• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dsg001
V2EX  ›  程序员

大模型都普及了,哪家的 ocr 可以比较完美的识别图中格式?

  •  
  •   dsg001 · Oct 20, 2023 · 4018 views
    This topic created in 957 days ago, the information mentioned may be changed or developed.

    比如代码、表格、缩进

    8 replies    2023-10-21 17:47:56 +08:00
    cccj1
        1
    cccj1  
       Oct 20, 2023
    wps 的识别还可以,表格识别很准,其他的不清楚
    tool2d
        2
    tool2d  
       Oct 20, 2023   ❤️ 1
    OCR 只能识别文字,识别不了表格。一般表格识别都是硬写代码,不是用 AI 的。

    AI 仅仅用于局部文本识别。
    BQsummer
        3
    BQsummer  
       Oct 20, 2023
    多模态的大模型还没有普及吧
    RatioPattern
        4
    RatioPattern  
       Oct 20, 2023
    google 的可以,其他都不行
    mMartin
        5
    mMartin  
       Oct 20, 2023
    paddleocr 识别表格还可以,有特定的模式
    em70
        6
    em70  
       Oct 20, 2023   ❤️ 1
    meta 在 8 月底开源了一个 OCR 项目 nougat,对数学公式支持非常好,专门识别论文的,输出格式是 Mathpix Markdown
    https://github.com/facebookresearch/nougat
    ovtfkw
        7
    ovtfkw  
       Oct 20, 2023
    扫描全能王
    uxfion
        8
    uxfion  
       Oct 21, 2023
    @em70 但是 nougat 根本就没支持中文,只有对拉丁系语言友好
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5637 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 56ms · UTC 07:08 · PVG 15:08 · LAX 00:08 · JFK 03:08
    ♥ Do have faith in what you're doing.