用的是 pyppeteer 框架,测试的是美亚网站,每分钟访问一次,大概 1-5 分钟换一次 ip,20 分钟左右还是会出现验证码页面
1
miao666 2021-10-18 13:52:15 +08:00 1
参考谷歌的机器人验证码
网站会收集你在网站里的鼠标滑行轨迹,点击动作频率,键盘动作等信息 从而判断你是否为机器人 |
2
xiaoqiao24 2021-10-18 14:35:34 +08:00 1
1. ip 的问题,有可能是 ip 在目标服务器已有黑名单记录,导致不能长时间爬取。建议用多个代理商搭建代理池。
2. 请求参数里面是否包含了有过期失效的参数,例如鼠标轨迹,点击检测等等数据。 |
3
zzm88104 OP @miao666 确实是完全没有模拟相关的操作,不过他最开始的几十次并不会触发机器人检测。不知道他是怎样把不同 ip 的请求关联起来的?
|
4
zzm88104 OP @xiaoqiao24 好的,我去检查下请求的参数
|
5
qq316107934 2021-10-18 15:16:47 +08:00
@zzm88104 每次请求前 cookies 是空的吗? local storage 一类的确定没被持久化下来数据吗?
|
6
perpetually 2021-10-18 16:44:15 +08:00
cookie,指纹信息,data 参数,这些都会变化
|