1
zhihaofans 2017-04-11 21:47:25 +08:00 via iPhone
→知乎
|
2
lyzy 2017-04-12 00:11:35 +08:00 via Android
自然语言处理啊
|
3
cnwtex 2017-04-12 00:19:01 +08:00
|
4
cnwtex 2017-04-12 00:25:30 +08:00
唯一有点技术含量的,可能是热点算法,如果感兴趣的同学,可以自行搜索 reddit 或者 hacknews 的相关技术分享文章,不知道做到那种级别了没有,至少投票因素还没有。
|
5
Livid MOD 貌似是想做一个中文的 TechMeme 么
|
6
popil1987 2017-04-12 09:47:50 +08:00
我做过类似的工作:
能做的: 自动分类, gensim 就可以做 做不到或者做不细的: 请注意标题下是有一段摘要的,我查看了一些,这些摘要有的来自 title ,有的不是 title ,是正文里的“导语: xxxxx ”,当然了有的 title 格式也不统一。抓取文章的时候不可能一个站点一个提取模式,如果是自动的话,能做到这样,在我这是没思路的。 |
7
laogui 2017-04-12 09:54:19 +08:00
他还有个类似 hackernews 的网站 http://news.dbanotes.net
|
9
twm 2017-04-12 10:35:46 +08:00 via iPhone
内容没有看头
|
10
mlhorizon 2017-04-12 10:49:43 +08:00
宽容点,等等看,看后面有没有进化。
|