• 请不要在回答技术问题时复制粘贴 AI 生成的内容
gamecreating
V2EX  ›  程序员

现在有什么开源项目 能识别图片中的文字的么?

  •  
  •   gamecreating · Oct 9, 2016 · 5634 views
    This topic created in 3512 days ago, the information mentioned may be changed or developed.

    比如截图后 能识别图片中的所有文字 (当然文字都是规范的) 能识别到文字所在图片相对位置.

    有什么开源的代码么? C/C++/python 都可

    8 replies    2016-10-11 09:54:02 +08:00
    kenshinji
        1
    kenshinji  
       Oct 9, 2016 via iPhone
    Pyteract?
    slysly759
        2
    slysly759  
       Oct 9, 2016 via Android
    @kenshinji 好像拼错了吧⊙▽⊙
    @题主 以前用汉皇还是一些 OCR 工具感觉除了拍照中书的字可以识别,其他手写啊倒着啊都不行
    你这个需求有点小困难啊,先不说草书 行书 单是什么瘦金体 旋转 你就需要训练模型| ू•ૅω•́)ᵎᵎᵎ
    现在流行的也不过识别验证码 或者图片归类什么的
    你看百度这么大公司那个图片搜索做的啥德行你就明白了(⁄ ⁄•⁄ω⁄•⁄ ⁄)
    reus
        3
    reus  
       Oct 9, 2016
    百度的 ocr 还可以,就是贵。这个东西如果做得好,赚钱很容易,不会轻易开源的
    rogerchen
        4
    rogerchen  
       Oct 9, 2016
    深度学习 again
    sutra
        5
    sutra  
       Oct 9, 2016
    tesseract
    sigroma
        6
    sigroma  
       Oct 10, 2016
    你说的截图是指随便拍照,还是电脑上的截图

    如果是第一种,这在 CV 上叫自然场景文字检测与识别( scene text localization and recognition ),是个挺难的问题,有个国际比赛 ICDAR 专注这方面问题,你可以看看这个比赛的历史论文,找作者要要源码
    google 翻译里就有这个功能

    如果是电脑截图,也可以利用这个方面的一些成果
    文字定位可以使用 SWT 算法,这个算法实现简单,效果还不错, github 上能找到很多源代码
    我比较推荐 ccv 这个库带的
    http://libccv.org/doc/doc-swt/
    文字的识别目前基本上就楼上提到的 tesseract 是能用的,如果你只限英文的话倒是还有些开源项目可选
    likuku
        7
    likuku  
       Oct 10, 2016
    隔壁也有个类似话题:
    https://www.v2ex.com/t/311454
    gamecreating
        8
    gamecreating  
    OP
       Oct 11, 2016
    @sutra 现在用的这个 识别速度很慢.. 而且需要训练后 才识别率高..
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   969 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 19:31 · PVG 03:31 · LAX 12:31 · JFK 15:31
    ♥ Do have faith in what you're doing.