目前有十万张图片,每张图片对应不同的浏览量、收藏数以及回复量,当然这三个量肯定是越大表示这张图片越有意思,但是怎么具体来量化一张图片有意思的程度呢?比如 A 图片浏览量、收藏数以及回复量是 2000:100:10 , B 图片是 900:150:8 , 怎么来具体量化排序 A 图片和 B 图片到底哪个最有意思?
1
ParallelMao 2017-01-17 14:47:42 +08:00
设置权值,比如可以设置浏览:收藏:回复 为 1:3:4 然后根据这个比例对应 2000:100:10 计算出来结果,数值越大代表越有意思,当然了这个值可以根据实际情况再做调整
|
3
menc 2017-01-17 15:21:12 +08:00
@qiayue
ryf 的 ranking model 基本过时了,不再适用于当前需求,这些 model 和公式都太弱了。 ranking 问题是机器学习的一个经典问题。 lz 的问题本质上和图片搜索引擎的 ranking 问题没有区别。 工业界最常用的方法是用 ctr 做训练目标来训练一个模型出来。 |
4
mko0okmko0 2017-01-17 15:31:56 +08:00
回覆量可以刷.很难分辨有效量
收藏量大致上准. 浏览量受到机器人影响.大致也准. 我个人的图片网站有做的: 个人图台使用的是参观者都给予惟一 hash.都入后就将该用户 hash 整合在一起. 记录每一张图片在画面上"完整呈现"时的秒数. 分析: 被收藏的图片完整呈现多久被搜藏.延伸题目:马上搜藏跟看很久才收藏的意义. 观看多久算是用户挂网.并排除. 收藏后再次被使用率. 用户回文是否灌水.用户是否有效. 发文者特性比例分析. 回文者特性比例分析. 搜藏者特性比例分析. 此图台利益与使用者利益交叉点.也就是这网站要赚钱又让用户不讨厌或是更喜欢的方法. 如何吸引用户将本网站推荐给他人. 基本上这本来就是一个很复杂的题目. 只能尽可能的收集用户的行为. 在去分析这真的是否有趣. 排序意义不大. |
5
geralt0725 2017-01-17 15:35:58 +08:00
简单解的话就是置顶权重规则来计算,复杂解的话就用机器学习算法训练权重
|