gosky
V2EX  ›  问与答

如何基于 LLM 翻译文图表混排的 PDF 文件?

  •  
  •   gosky · 2 days ago · 684 views
    有份 PDF ,内容如下图所示。本来也有中文翻译版,但是翻译的太差了。
    我曾经自己写脚本,调用 LLM API 翻译 EPUB 文件。
    但这种 PDF ,还是文图表混排的 PDF ,完全没头绪。

    6 replies    2026-05-12 10:59:15 +08:00
    aikilan
        1
    aikilan  
       2 days ago
    试试 paddleOCR
    SuperDaniel313
        2
    SuperDaniel313  
       2 days ago

    是想要这样的效果吗?
    gosky
        3
    gosky  
    OP
       2 days ago
    @SuperDaniel313 是的。不过你这个没图片和表格
    stargo
        4
    stargo  
       2 days ago
    mineru
    rpish
        5
    rpish  
       1 day ago
    先转 LaTex
    iorilu
        6
    iorilu  
       1 day ago
    mineru 有 api 调用方式, 可以官方看看

    当然了, 有 gpu 也可以本地运行, 不过很慢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3249 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 12:15 · PVG 20:15 · LAX 05:15 · JFK 08:15
    ♥ Do have faith in what you're doing.