微博和贴吧都是国内数一数二的 PHP 构建的高并发网站,请问他们的这个热门话题排行榜是如何得出的?我目前只想得到用中文分词库对全站内容分词和统计,但是这类高并发网站每天都是成千上亿的数据产出,用分词的话如何是如果解决效率问题的?或者他们还用了其他什么技术?
1
hshpy 2016-10-19 12:48:36 +08:00
给钱的,强制输送,不说了都是套路
|
2
Quaintjade 2016-10-19 12:57:58 +08:00 via Android
有的是塞钱的,有的是管理员手动添加的。只不过是针对已知词组进行统计。
倒是搜索引擎的搜索词趋势报告可能涉及分词。 |
3
ibufu 2016-10-19 14:08:52 +08:00
题主是不是很失望
|
4
murmur 2016-10-19 14:11:16 +08:00
我猜 80%是给钱推广的 20%是真的热点 毕竟那种党和国家的大事都要给钱推广 新浪估计要关门了
|
5
cnZary 2016-10-19 15:42:27 +08:00
用钱生成的
|
6
sensui7 2016-10-19 17:32:16 +08:00
你还以为是算法生成的? 乃衣服啊, 无利不起早, 国内凡是各种排行榜, 热门推荐都是........
|
7
kaneg 2016-10-19 18:47:54 +08:00 via iPhone
本以为是个技术问题,实际却是个商业问题
|