V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Ricky123
V2EX  ›  问与答

这种验证码能被识别破解不?

  •  
  •   Ricky123 · 2015-12-17 11:13:09 +08:00 · 4480 次点击
    这是一个创建于 3263 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如下验证码能被识别破解不
    有没有什么思路可以借鉴


    1

    2

    3

    26 条回复    2015-12-19 16:05:55 +08:00
    iambic
        1
    iambic  
       2015-12-17 11:30:35 +08:00
    最后一个是输入那五个字还是输入结果?
    winnie2012
        2
    winnie2012  
       2015-12-17 11:40:01 +08:00
    可以啊,人肉打码,一分钱一个,中国闲着没事干的人一堆一堆的。
    Ricky123
        3
    Ricky123  
    OP
       2015-12-17 11:40:34 +08:00
    @iambic 最后一个是输入结果
    Ricky123
        4
    Ricky123  
    OP
       2015-12-17 11:41:28 +08:00
    @winnie2012

    ...
    对于这种有什么机器的方法思路么
    supman
        5
    supman  
       2015-12-17 12:00:52 +08:00 via iPad
    好牛掰的验证码啊
    LuoLuoKaka
        6
    LuoLuoKaka  
       2015-12-17 12:02:49 +08:00   ❤️ 1
    @winnie2012 可以把它做成游戏
    jacy
        7
    jacy  
       2015-12-17 12:13:25 +08:00
    汉字的 ocr 技术很落后的
    wbsdty331
        8
    wbsdty331  
       2015-12-17 12:34:30 +08:00
    我记得 我以前搜狐帐号找回密码 就是这种
    ihciah
        9
    ihciah  
       2015-12-17 15:51:56 +08:00
    看起来字的位置大致固定,所以直接切开扔 CNN 即可。
    训练集可以自己生成。
    可以用 VGG19 做 finetune
    ihciah
        10
    ihciah  
       2015-12-17 15:52:58 +08:00
    btw , 99%+肯定没有问题的
    ooxxcc
        11
    ooxxcc  
       2015-12-17 16:07:46 +08:00
    @ihciah ……我去实验一下……
    Mutoo
        12
    Mutoo  
       2015-12-17 16:12:47 +08:00
    人肉打码明码标价 http://www.jsdati.com/page/price
    cevincheung
        13
    cevincheung  
       2015-12-17 16:16:00 +08:00
    还是自己用拖拽验证吧…… 用非主流验证方式就行。
    kasp
        14
    kasp  
       2015-12-17 16:43:28 +08:00
    企业信用信息公示系统就是用的这种
    xierch
        15
    xierch  
       2015-12-17 20:03:58 +08:00
    还都是成语.. 那这样组合就更少了,不是更容易..
    10iii
        16
    10iii  
       2015-12-17 21:03:15 +08:00
    前两天从 V2 连过去的 企业信用信息公示系统+1
    TaMud
        17
    TaMud  
       2015-12-18 00:59:06 +08:00
    @ihciah 有作品可供演示不?
    tomb003
        18
    tomb003  
       2015-12-18 02:19:00 +08:00   ❤️ 2
    这种验证码识别非常容易,做这个验证码的人一看就没研究过破解验证码,属于闭门造车自己想象出来的。
    首先,每个字的颜色都不一样,和背景的颜色也不一样,直接就可以扣出所有的单字。
    由于汉字是方块的,可以很容易得到扣出字的四边。
    得到四边后就可以求得扭曲的角度,转成正常未扭曲过的单字。
    由于每个字都是单色的,可以很容易转成黑白两色矩阵,减少比对需要的数据量。
    剩下的就是找出这个验证码用的所有字体。
    然后用二分查找法比对,非常快。
    wxg4net
        19
    wxg4net  
       2015-12-18 08:05:18 +08:00
    @tomb003 真棒
    Ricky123
        20
    Ricky123  
    OP
       2015-12-18 08:32:08 +08:00
    @kasp
    是的
    在研究这个...
    mcone
        21
    mcone  
       2015-12-18 10:07:23 +08:00
    前 2 个很简单,( 1 )字体颜色居然没变化,背景干扰可以很简单的通过 RGB 就给扔掉了,出了偶尔的粘连,字符切割基本不会出现任何问题;( 2 )没感觉错的话,这字没有经过扭曲吧,貌似就一个旋转?………切分好的话,完全是上世纪末就能解决的问题(实验室环境+工业界都有),即使是汉字,这是最标准的 OCR 。最重要的,( 3 ),居然是成语啊……他想不开么…………成语的话更简单了,找个词库,四个字第一候选认出来两个,认错 2 个,也能从其他候选里面纠正出来……

    第三个的话,得加上语义分析,就不是简单的 OCR 的操作了。不住要做这个,不多讲
    TaMud
        22
    TaMud  
       2015-12-18 11:10:58 +08:00
    @mcone 有可供演示的作品不?
    TaMud
        23
    TaMud  
       2015-12-18 11:14:24 +08:00
    @tomb003 有可供演示的作品不
    ihciah
        24
    ihciah  
       2015-12-18 17:03:56 +08:00
    @TaMud 上次电子科大办了一个验证码识别大赛我们拿了第二名,几种验证码有的是中文的,有的是英文的,我们全是用深度学习做的。传统 OCR 搞搞简单的还行,复杂一点就不好说了。
    TaMud
        25
    TaMud  
       2015-12-19 15:02:40 +08:00
    @ihciah 有演示不?要不我给你些验证码,给个结果我,我只要看到演示结果就行了,有报酬
    ihciah
        26
    ihciah  
       2015-12-19 16:05:55 +08:00
    @TaMud 私戳我 id@gmail
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   933 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 21:28 · PVG 05:28 · LAX 13:28 · JFK 16:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.