现在有一系列商品,每个商品都有若干个用户的 1-5 星打分,最终这一系列商品按好评排序展示给用户。举几个例子,豆瓣电影,美团外卖,携程酒店,淘宝等,按好评排序。不考虑综合排序,只是考虑好评排序。最终的排序结果期望是对于大多数人来说,第一名是比第二名好的,以此类推。
最简单也是最常用的方法,求平均再排,但是问题很多。
1. 不能保证每个商品都有比较多的用户打分,所以少打分的商品可能波动比较大
2. 可能受到水军的影响,如何需要鉴别这些用户
3. 每个人的评判标准不一样,导致最后平均分有很大差别。比如,携程酒店上面青旅容易拿高分,而高档酒店有很多会扑街,背后可能只是评分的人的标准不一样。携程也做了一些尝试比如有和你偏好相似的人的评分,应该是通过聚类的方法,从而生成多个排序列表。
4. 每个用户的评分过的商品是全部排序里面的很少一部分,所以不能像投票一样做出上帝视角的排序,只能说这个用户觉得 5 星的应该是比这个用户觉得 4 星的好,所以怎么整合这种数据也是非常困难的问题。
有什么文献或者做过的同学给点想法吗?
最简单也是最常用的方法,求平均再排,但是问题很多。
1. 不能保证每个商品都有比较多的用户打分,所以少打分的商品可能波动比较大
2. 可能受到水军的影响,如何需要鉴别这些用户
3. 每个人的评判标准不一样,导致最后平均分有很大差别。比如,携程酒店上面青旅容易拿高分,而高档酒店有很多会扑街,背后可能只是评分的人的标准不一样。携程也做了一些尝试比如有和你偏好相似的人的评分,应该是通过聚类的方法,从而生成多个排序列表。
4. 每个用户的评分过的商品是全部排序里面的很少一部分,所以不能像投票一样做出上帝视角的排序,只能说这个用户觉得 5 星的应该是比这个用户觉得 4 星的好,所以怎么整合这种数据也是非常困难的问题。
有什么文献或者做过的同学给点想法吗?