Ricky123
V2EX  ›  问与答

这种验证码能被识别破解不?

  •  
  •   Ricky123 · Dec 17, 2015 · 5278 views
    This topic created in 3822 days ago, the information mentioned may be changed or developed.

    如下验证码能被识别破解不
    有没有什么思路可以借鉴


    1

    2

    3

    26 replies    2015-12-19 16:05:55 +08:00
    iambic
        1
    iambic  
       Dec 17, 2015
    最后一个是输入那五个字还是输入结果?
    E2gCaBAT5I87sw1M
        2
    E2gCaBAT5I87sw1M  
       Dec 17, 2015
    可以啊,人肉打码,一分钱一个,中国闲着没事干的人一堆一堆的。
    Ricky123
        3
    Ricky123  
    OP
       Dec 17, 2015
    @iambic 最后一个是输入结果
    Ricky123
        4
    Ricky123  
    OP
       Dec 17, 2015
    @winnie2012

    ...
    对于这种有什么机器的方法思路么
    supman
        5
    supman  
       Dec 17, 2015 via iPad
    好牛掰的验证码啊
    LuoLuoKaka
        6
    LuoLuoKaka  
       Dec 17, 2015   ❤️ 1
    @winnie2012 可以把它做成游戏
    jacy
        7
    jacy  
       Dec 17, 2015
    汉字的 ocr 技术很落后的
    wbsdty331
        8
    wbsdty331  
       Dec 17, 2015
    我记得 我以前搜狐帐号找回密码 就是这种
    ihciah
        9
    ihciah  
       Dec 17, 2015
    看起来字的位置大致固定,所以直接切开扔 CNN 即可。
    训练集可以自己生成。
    可以用 VGG19 做 finetune
    ihciah
        10
    ihciah  
       Dec 17, 2015
    btw , 99%+肯定没有问题的
    47jm9ozp
        11
    47jm9ozp  
       Dec 17, 2015
    @ihciah ……我去实验一下……
    Mutoo
        12
    Mutoo  
       Dec 17, 2015
    人肉打码明码标价 http://www.jsdati.com/page/price
    cevincheung
        13
    cevincheung  
       Dec 17, 2015
    还是自己用拖拽验证吧…… 用非主流验证方式就行。
    kasp
        14
    kasp  
       Dec 17, 2015
    企业信用信息公示系统就是用的这种
    xierch
        15
    xierch  
       Dec 17, 2015
    还都是成语.. 那这样组合就更少了,不是更容易..
    10iii
        16
    10iii  
       Dec 17, 2015
    前两天从 V2 连过去的 企业信用信息公示系统+1
    TaMud
        17
    TaMud  
       Dec 18, 2015
    @ihciah 有作品可供演示不?
    tomb003
        18
    tomb003  
       Dec 18, 2015   ❤️ 2
    这种验证码识别非常容易,做这个验证码的人一看就没研究过破解验证码,属于闭门造车自己想象出来的。
    首先,每个字的颜色都不一样,和背景的颜色也不一样,直接就可以扣出所有的单字。
    由于汉字是方块的,可以很容易得到扣出字的四边。
    得到四边后就可以求得扭曲的角度,转成正常未扭曲过的单字。
    由于每个字都是单色的,可以很容易转成黑白两色矩阵,减少比对需要的数据量。
    剩下的就是找出这个验证码用的所有字体。
    然后用二分查找法比对,非常快。
    wxg4net
        19
    wxg4net  
       Dec 18, 2015
    @tomb003 真棒
    Ricky123
        20
    Ricky123  
    OP
       Dec 18, 2015
    @kasp
    是的
    在研究这个...
    mcone
        21
    mcone  
       Dec 18, 2015
    前 2 个很简单,( 1 )字体颜色居然没变化,背景干扰可以很简单的通过 RGB 就给扔掉了,出了偶尔的粘连,字符切割基本不会出现任何问题;( 2 )没感觉错的话,这字没有经过扭曲吧,貌似就一个旋转?………切分好的话,完全是上世纪末就能解决的问题(实验室环境+工业界都有),即使是汉字,这是最标准的 OCR 。最重要的,( 3 ),居然是成语啊……他想不开么…………成语的话更简单了,找个词库,四个字第一候选认出来两个,认错 2 个,也能从其他候选里面纠正出来……

    第三个的话,得加上语义分析,就不是简单的 OCR 的操作了。不住要做这个,不多讲
    TaMud
        22
    TaMud  
       Dec 18, 2015
    @mcone 有可供演示的作品不?
    TaMud
        23
    TaMud  
       Dec 18, 2015
    @tomb003 有可供演示的作品不
    ihciah
        24
    ihciah  
       Dec 18, 2015
    @TaMud 上次电子科大办了一个验证码识别大赛我们拿了第二名,几种验证码有的是中文的,有的是英文的,我们全是用深度学习做的。传统 OCR 搞搞简单的还行,复杂一点就不好说了。
    TaMud
        25
    TaMud  
       Dec 19, 2015
    @ihciah 有演示不?要不我给你些验证码,给个结果我,我只要看到演示结果就行了,有报酬
    ihciah
        26
    ihciah  
       Dec 19, 2015
    @TaMud 私戳我 id@gmail
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3215 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 70ms · UTC 12:34 · PVG 20:34 · LAX 05:34 · JFK 08:34
    ♥ Do have faith in what you're doing.