如题,遇到有验证码的网站,就完全爬不起来了,请大家指点一下,谢谢了。
1
tumbzzc 2017-10-25 13:35:20 +08:00
接入打码平台
|
2
comeluder 2017-10-25 13:38:25 +08:00
打码兔~~
|
3
hcnhcn012 2017-10-25 13:42:59 +08:00 1
|
4
gaojin 2017-10-25 14:37:00 +08:00
如果自己玩的话 ,那就把图片下载下来,手动输入,
大规模的话,可以机器学习识别 或者 接入第三方打码平台。 |
5
tcsky 2017-10-25 15:07:29 +08:00
除了手动, 其他都是付费的
|
6
toono 2017-10-25 16:48:22 +08:00
安装 tesseract,然后 Python 调用。
觉得不准确的话,自己写配置去训练。 |
7
zhangsen1992 2017-10-25 17:27:36 +08:00
机器学习?自己训练?
|
8
zbl430 2017-10-25 17:50:13 +08:00
什么样子的验证码,发来瞧瞧
|
9
ppwangs 2017-10-25 17:55:41 +08:00
只是登录的话,保存 cookie 定时刷新。
我最近正好做相关的东西,识别验证码真复杂。 |
10
Sanko 2017-10-25 18:04:09 +08:00 via Android
目前在用阿里云的英数
|
11
qq316107934 2017-10-25 18:06:25 +08:00 via Android
把验证码发出来看看,不一定要用打码平台
|
12
JayFang1993 2017-10-26 10:04:52 +08:00
就微博这种怎么处理? |
13
sniperhgy OP 谢谢各位的回应,暂时用了 tesseract,但是识别度有点低,验证码只要稍微一变点花样,就不能正确识别了
|