1
panpanpan 2017-09-26 14:29:41 +08:00 1
tesseract
|
2
xmbaozi 2017-09-26 14:32:07 +08:00
前段时间也是研究这个。
直接到一些提供验证码服务的网站测试 |
3
realfreesky OP @xmbaozi 有网站推荐不
|
4
xmbaozi 2017-09-26 14:53:01 +08:00
验证码识别 搜索下
|
5
Revenant 2017-09-26 16:54:38 +08:00
提供验证码平台好多是人工打码的,我同事的老婆坐月子的时候就在打码平台赚外快
|
6
gengfire 2017-09-26 17:05:09 +08:00
谷歌 tesseract https://github.com/tesseract-ocr/tesseract
|
7
zgbgx1 2017-09-26 17:14:14 +08:00
图片 验证码 这东西,越来越难作为 图灵测试的工具了
|
8
Marsss 2017-09-27 09:02:34 +08:00
看楼主提到 OCR,那么应该说的是图片字符类型的验证码。三种建议:
1.比较清晰简单的那种,直接 tesseract。 2.上 cnn (卷积神经网络),需要标注样本,自己去标注的话,眼睛会瞎的,样本数量起码需要万级左右,可以借助打码平台,需要一定的费用。 3.使用简单的 mlp (多层感知器),也就是普通的神经网络,针对要识别的验证码,设计一种有效的切割算法,将字符进行切割,这种方法只需要标注几百张样本,就可以达到比较好的效果。几百张自己就搞定了,不需要产生费用。 |