网站需要登录,单个进程爬取的话没有问题,但多进程爬取的时候,就会出现没有登录的情况
1
264768502 Sep 22, 2016 via Android
io 密集请用异步或者多线程
为什么用多进程? |
2
superalsrk Sep 22, 2016
请换成 subprocess
|
3
superalsrk Sep 22, 2016
额。。说错。。。
|
4
TaMud Sep 22, 2016
CURL + COOKIE FILE
|
5
iyaozhen Sep 22, 2016 via Android
Python 的这个多进程没有多线程好用
|
6
xingzhi Sep 23, 2016
不管是多进程还是多线程,确保只登录一次,共享同一个 Cookies 就好了。
|
7
reself Sep 23, 2016 via Android
cookie file ,或者 key-value 数据库例如 Redis 什么的
|