V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
KevinBu
V2EX  ›  Python

各位大佬,请教一下验证码去除干扰线和矫正的问题,有图了😭

  •  1
     
  •   KevinBu · 2018-12-19 17:53:31 +08:00 · 2903 次点击
    这是一个创建于 2168 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在用 Python 做爬虫,碰到了这种验证码(降噪 /二值化处理后的)

    现在想要将干扰线去掉,最好能矫正一下字符,不吝赐教。

    9 条回复    2018-12-20 14:30:57 +08:00
    EvilCult
        1
    EvilCult  
       2018-12-19 18:49:38 +08:00
    这干扰线.......
    都跟字母的笔画一边粗了吧.......
    这可咋整....
    囧....
    zuoyouTU
        2
    zuoyouTU  
       2018-12-19 18:56:15 +08:00
    连续斜率?
    arrow8899
        3
    arrow8899  
       2018-12-19 20:04:15 +08:00
    这种只有切图了
    as9t
        4
    as9t  
       2018-12-19 20:59:34 +08:00
    深度训练
    jdhao
        5
    jdhao  
       2018-12-20 00:07:00 +08:00 via Android
    建议深度学习训练模型,样本的话可以自己生成,尽量拟合真实样本,效果应该不错。
    KevinBu
        6
    KevinBu  
    OP
       2018-12-20 09:07:50 +08:00
    @EvilCult 是阿,跟字母差不多粗,怎么去噪都去不掉
    KevinBu
        7
    KevinBu  
    OP
       2018-12-20 09:09:24 +08:00
    @jdhao 这样训练模型是不是要挺长时间的
    jdhao
        8
    jdhao  
       2018-12-20 09:15:40 +08:00 via Android
    @KevinBu 看你用 gpu 还是 cpu 训练,几十万样本,gpu 四五天可以跑完,cpu 就很慢了
    boom7
        9
    boom7  
       2018-12-20 14:30:57 +08:00 via Android
    前几天一个类似的验证码,搞了二十万数据,去腾讯云开了个 gpu 机器训练,两个小时跑完,最终测试的验证码通过率有九十多
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3368 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:05 · PVG 20:05 · LAX 04:05 · JFK 07:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.