noobpythoner's recent timeline updates
noobpythoner

noobpythoner

V2EX member #229286, joined on 2017-05-05 18:55:40 +08:00
noobpythoner's recent replies
oh,糟了
Jun 8, 2017
Replied to a topic by Yingruoyuan Python scrapy 下载图片到 4w 张左右总是会卡住
可以使用 scrapy_redis 来完成,所有的去重都是通过 redis 来完成的,还能够做到状态保持,如果需要可以实现分布式,redis 的内容类似下面,
redis > keys *
1) "***:dupefilter"
2) "***:items"
3) "***:requests"

或者可以迭代的读取数据库的内容,下一次请求之前从内存中删除上一次的请求地址,类似 https://www.ibm.com/developerworks/cn/xml/x-hiperfparse/
这个方法我自己没有试过,但是应该是可行的
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3032 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 132ms · UTC 12:03 · PVG 20:03 · LAX 05:03 · JFK 08:03
♥ Do have faith in what you're doing.