在学习 scrapy 中,比如抓豆瓣小组。
1 、抓文章列表信息
这个好理解,按照网上的例子做到了。
2 、抓小组简介,小组建立时间等
是单独建一个 item 类,单独一个 pipeline ,还是在同一个 pipeline 里保存到数据库?
看了文档,没太理解怎么做。对 pipeline 的机制不太清楚。
谢谢!
1 、抓文章列表信息
这个好理解,按照网上的例子做到了。
2 、抓小组简介,小组建立时间等
是单独建一个 item 类,单独一个 pipeline ,还是在同一个 pipeline 里保存到数据库?
看了文档,没太理解怎么做。对 pipeline 的机制不太清楚。
谢谢!