V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
drymonfidelia
V2EX  ›  程序员

要微调 OCR 产品,提高手机拍屏照片中的序列号识别率(大写字母、数字),字形固定,有什么推荐方案?拍的是内网设备,物理隔离外网

  •  
  •   drymonfidelia · 116 天前 via iPhone · 2044 次点击
    这是一个创建于 116 天前的主题,其中的信息可能已经有所发展或是发生改变。
    14 条回复    2024-07-17 15:06:24 +08:00
    mMartin
        1
    mMartin  
       116 天前
    paddleocr 啊 训练部署都简单 只不过是百度的 有恶心人的地方
    drymonfidelia
        2
    drymonfidelia  
    OP
       116 天前 via iPhone
    @mMartin 现在用的就是 paddleocr ,每天都内存泄露把 256GB 内存占满,需要每小时重启
    mMartin
        3
    mMartin  
       116 天前
    @drymonfidelia #2 不至于内存泄露吧 我们一直用 应该是你们用法有问题
    raycool
        4
    raycool  
       116 天前
    排查下吧,换个部署方案。
    同用 paddleocr
    无内存泄漏问题。
    drymonfidelia
        5
    drymonfidelia  
    OP
       116 天前
    @mMartin
    @raycool 这个内存泄露的问题我三个多月前就在 v2 问过了,有样本代码 /t/1030071 现在越来越严重了
    goxxoo
        6
    goxxoo  
       115 天前
    国外有一家 Tesseract OCR, 我用的识别率 100% 大写字母和数字, C#的 应该也有其他平台,本地调用
    ShareDuck
        7
    ShareDuck  
       115 天前
    @mMartin #1 之前试用过,没有深入了解。可以具体说说有什么恶心人的东西吗?好让我们今后避坑。
    NightFlame
        8
    NightFlame  
       115 天前
    paddleocr + 1
    mMartin
        9
    mMartin  
       115 天前
    @ShareDuck #7 内部代码结构混乱 有路径写死的地方 paddle 臃肿
    elboble
        10
    elboble  
       115 天前
    cnocr ?可以 docker 部署
    KIMI360
        11
    KIMI360  
       115 天前
    intern vl ,glm4v 这些视觉模型也可以试试。
    zuiyue123
        12
    zuiyue123  
       115 天前
    有好多开源的 可以试试
    beginor
        13
    beginor  
       115 天前 via Android
    没人关注 phi-3-vision 么?
    tarasha
        14
    tarasha  
       115 天前
    换个部署方案吧。转 onnx ,有显卡的话用 trt 更快(启动慢)。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1626 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 16:55 · PVG 00:55 · LAX 08:55 · JFK 11:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.