1
faceair 2014-02-01 12:23:14 +08:00
要做图书馆数据整合,刚巧用得上,谢~
|
2
alexapollo OP @faceair 哈哈~ 大恩不言谢,红包呢!
|
3
alexapollo OP 更新了hrtencent的爬取~
|
4
lincanbin 2014-02-01 23:31:39 +08:00
上个月写过一个爬豆瓣读书的,为了整合一个图书馆系统。
豆瓣读书有一个现成的API,Response是JSON格式,非常方便。 |
5
alexapollo OP @lincanbin 多谢回复。有看过API,但这个工程也仅是为了练Scrapy :)
|
6
bearcat001 2014-02-02 09:55:38 +08:00
你用递归了吗?scrapy如何做递归比较舒服...?
我一直再用yield Request,可控性不高 |
7
alexapollo OP @bearcat001 递归的目的是?爬整站吗?我原来写了一套递归系统,但感觉Rule还挺好用,就都废弃了
|
8
funcman 2014-02-03 02:50:43 +08:00
豆瓣的数据根本不值得爬。
|
9
alexapollo OP @funcman Example而已。。
|
10
funcman 2014-02-03 13:44:38 +08:00
@alexapollo 是对想弄图书馆数据的一楼说的。
|
11
robertlyc 2014-02-04 12:21:22 +08:00
豆瓣有api提供
|