以前单独建表,分词,但是 tag 已经有 1 亿多个了,导致网站运行很慢。
还有其他办法么?
1
JasperYanky 2017-05-05 12:29:42 +08:00
现在采集站好做么
|
2
mon3 OP @JasperYanky 做了 4 个月,每天 50 刀左右。
|
5
cevincheung 2017-05-05 13:17:25 +08:00
上搜索引擎,缓存
|
6
mon3 OP @cevincheung 文章页调用 elasticsearch 的结果???
|
7
cevincheung 2017-05-05 14:03:05 +08:00
@mon3 #6 对啊。可以试试啊。
|
8
mon3 OP @cevincheung 我现在就是这样做的。我当时想了一上午想出了这个办法, 可是我感觉不是太好。 其他过亿数据量的站点也很多是这样做的?
|
9
JasperYanky 2017-05-05 15:04:38 +08:00
@mon3 基本就是上 ES 后端直接渲染嫌慢的话 前端去 es 上查询;话说这样好像对 SEO 不太好
对于这种采集类的网站,我的想法是上 ES 然后直接 每篇文章生成的时候就查询好相关文章 ,然后直接写到该数据里,简单粗暴;当然可以只保留 id 然后二次再查询。 仅仅对采集站而言的,采集站有个特点是,用户浏览不多,但是搜索引擎爬的很厉害,所以简单粗暴也许更好点 |