说明:
- 并不想消费这个舆论热点,这是我以前在团队内部的分享。只是正好和现在的讨论相关,于是分享给大家,算是一点补充,以供参考.
- 我是豆瓣的老用户了,标题只是当时的好玩起的,并不代表此次事件中的立场.
- 这是当时开源的代码, 完整的 notebook 分析
0. 问题的介绍
起因
看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.

其他的电影也有这个问题
像白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的

你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大
这两部电影的评分是 8.3, 而其他同样评分的电影,我就觉得挺好的,像下面这几部
再比如超人钢铁之躯, 就是我很喜欢,但是分数很低,以前周星驰的功夫也是如此,不过近几年有回升
问题
再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?
于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异
1. 数据概况
从Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部
IMDB/豆瓣 /Metacritic 分布

豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的

顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大
基本的电影列表概况展示

具体见notebook
需要注意的是,实际会有一些豆瓣评分为 0 的电影
这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook
接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响
2. 散点图比较
2.1 散点图

散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址
这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现
- 豆瓣和 IMDB 的电影评分,并不是 1:1 的关系
两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故
IMDB: 10 星制。没有人会打 10 星
豆瓣: 5 星制。 4 星以上都会打 5 星
豆瓣的打分制概念简单,不需要太精确,体验更好
-
IMDB 比豆瓣要齐整得多。豆瓣确实有一些电影,偏离回归线较大, 集中在 4, 6 分区间
-
具体做成了交互式的图表,大家可以玩一玩,看看有什么发现
2.2 基本概况观察

根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook
3. 进一步的观察
3.1 类别会有影响吗?
仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的

那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较

这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。

在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图
3.2 国别会有影响吗?
另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师

我们同样也可以画出一条散点图比较

然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。
- 在上面的例子中,少林的评分是豆瓣较低的,而让子弹飞、一代宗师是豆瓣评分较高的
- 个人人为,一方面,对于外国观众,由于东方文化存在异域魅力,所以分数会有加成比如少林。但同样,一些国外观众不理解的电影,比如让子弹飞、一代宗师,由于文化隔阂,也不会给出特别高的分数
- 但总体而言,优秀的电影,分数总会是高的,质量一般的电影. 这个现象,更出现在英雄、十面埋伏、夜宴等电影中

3.3 恶意差评?
这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了
请猜一下,这部电影的 IMDB 评分是多少?

4. 结论
- 豆瓣和 IMDB 的评分,确实有差别,但差别其实并不大,主要应是评分机制引起
- 对于动画类评分,国内确实有偏高的现象
- 对于国内电影评分,国内外的电影差别挺大,文化差异可能是主要的原因
- 恶意差评的现象,是存在的。国外也有这种现象,实际是一种“娱乐心态”、玩笑行为。作为消费者的个人行为,我觉得应该是允许的. 如果真的需要一个客观的评定,可以把这个交给专业影评人,就像 Metacritic 那样,把分数调整成规整的 5 为均值,前后对称的分布.