[入门实践] - 怎样用机器学习来提取网页正文

This topic created in 2866 days ago, the information mentioned may be changed or developed.

这是我第一次用机器学习来解决实际问题。之前一直是知道很多理论知识，但没找到合适的项目练手，后来突然想到可以把我提取Hacker News正文的算法用机器学习重新实现一遍。

所以有了这篇 Notebook 笔记，希望能够抛砖引玉，启迪更多的人：

4 replies • 2018-09-27 11:10:03 +08:00

1

ClutchBear

Sep 18, 2018

1

Newspaper3k ?

2

tshwangq

Sep 18, 2018

1

nice

3

polythene

OP

Sep 18, 2018

@ClutchBear 哇，感谢分享！要是早点知道有这么神奇库，我就不用辛苦的发明轮子了，羡慕人家能把新闻分析做成这么成熟的库~

@tshwangq Thanks

4

yemoluo

Sep 27, 2018

过来膜拜下