sdielpf
V2EX  ›  Java

有没有解析 word 文档为结构化数据的工具

  •  
  •   sdielpf · Oct 20, 2022 · 2486 views
    This topic created in 1317 days ago, the information mentioned may be changed or developed.

    如题,我这里有一堆 word 文档,内容会按标题格式或者序号的形势来排列,有没有工具能够将这些内容结构化出来存到数据库中呢?

    2 replies    2022-10-21 13:20:15 +08:00
    akagishigeru
        1
    akagishigeru  
       Oct 20, 2022 via iPhone
    如果只是文字的话,可以解析成 xml 处理
    damai0419
        2
    damai0419  
       Oct 21, 2022
    刚做的需求。
    我们是解析 word 试卷,里面还包含图片公式之类的。
    word --> html ,然后解 html 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2471 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 15:51 · PVG 23:51 · LAX 08:51 · JFK 11:51
    ♥ Do have faith in what you're doing.