1
SeaRecluse 2019-08-27 11:11:07 +08:00 2
分析抓取的数据分布有问题,不同类型的电影不应该用同一分数去切,应该先统计不同类型下的得分分布然后去切。例如动画的得分一般偏高,以及国产标签的 debuff (小声)
|
2
cifermail OP @SeaRecluse 这些也想到了,动画片、同性片、评分基数小于 1000 人的冷门片、部分国产膨胀片、部分媚外片、幸存者偏差片、水军片都是评分虚高的。一方面把这些因素都考虑在内就太复杂了,这些应该是评分网站去评估的事,报告只负责统计;另一方面,如果分开类型统计,数据量就太小了,意义不大。
|
3
ysoserious 2019-08-27 19:00:08 +08:00 via Android
有意思。 可是博客申请通知权限是什么鬼?
|