多个新闻网站通用爬虫解决方案？

This topic created in 1720 days ago, the information mentioned may be changed or developed.

1 需要获取多个农业相关网站的新闻数据，这些数据都在类似于这样的网站( http://www.moa.gov.cn/)里面

2 这些网站里面还有大量的列表页和翻页内容，如果逐个写 xpath 或者正则翻页请求过于繁琐

3 有没有比较简单的包可以调用可以直接通用解决此类网站的所有列表页链接？

4 以及有没有一键启动所有的这些爬虫的方案，减少操作

列表页

网站

爬虫

通用

3 replies