V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Daybyedream
V2EX  ›  问与答

OCR 怎么提高准确率?

  •  
  •   Daybyedream · 45 天前 · 1573 次点击
    这是一个创建于 45 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近有一大批图片需要识别,都是一个样式的,算是很标准的图片。
    上面 16 个字符(数字大写字母)
    下面 6 个数字
    暂时就是用 umi-ocr 工具
    发现默认的英文中文,识别出来都有些问题。1000 多张会有 10 个左右有问题。
    识别出来上面不是 16 个字符。
    求解怎么弄好点。
    15 条回复    2024-08-05 09:57:54 +08:00
    busier
        1
    busier  
       45 天前 via iPhone
    你都确定是一个样式了 先将图片除了那 16 个字符外面,多余的部分裁剪掉啊
    Daybyedream
        2
    Daybyedream  
    OP
       45 天前
    @busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ,有些 YL 之类的识别错。
    trungdieu031
        3
    trungdieu031  
       45 天前
    标注或合成一部分数据,自己训练/微调一个模型
    akira
        4
    akira  
       45 天前
    试试 传统 ocr + 大语言模型的 方案, 例如 llama index 这些
    tool2dx
        5
    tool2dx  
       45 天前
    提不了,类似 GPT 回答 100%正确率一样,不太可能。

    可以多个模型交叉验证,或者做一次识别后文字的 rasterization ,对比图片前后相似度。
    miaomiao888
        6
    miaomiao888  
       45 天前
    想要高精度就别用离线了,试试合合 OCR ,业界精度最高。
    weiwoxinyou
        7
    weiwoxinyou  
       45 天前
    如果是标准的数字和字母,不需要什么高级算法,纯按传统的图片识别方式就行,python 直接调 opencv 的 api 就行
    uTOmOuk3L6sb4MSI
        8
    uTOmOuk3L6sb4MSI  
       45 天前 via iPhone
    @weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api
    paopjian
        9
    paopjian  
       45 天前
    固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?
    Les1ie
        10
    Les1ie  
       45 天前
    paddleocr 效果很棒,资源占用少,离线部署简单
    Daybyedream
        11
    Daybyedream  
    OP
       45 天前
    @weiwoxinyou 大概懂了,直接一个个字符截出来然后识别?这样?反正就那么几个
    Daybyedream
        12
    Daybyedream  
    OP
       45 天前
    @trungdieu031 我去研究下
    seeu2ex
        13
    seeu2ex  
       45 天前 via iPhone
    如果是线条加数字英文的话可以试试调对比度等,直接给去除无用线条,在加深可用部分的颜色深度
    SWALLOWW
        14
    SWALLOWW  
       44 天前
    微信有没有接口
    yaleyu
        15
    yaleyu  
       44 天前
    图片剪裁一下,然后二值化一下,paddleocr, easyocr, rapidocr 都识别一次,再对比一下识别结果,应该不会出错。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5233 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 01:23 · PVG 09:23 · LAX 18:23 · JFK 21:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.