ruicky
V2EX  ›  问与答

智能识别 word 版考题、懂得给个思路,谢谢!

  •  
  •   ruicky · Mar 14, 2019 via iPhone · 2470 views
    This topic created in 2617 days ago, the information mentioned may be changed or developed.
    智能识别 word 版考题、懂得给个思路,谢谢!

    如题,就是有 word 版的考题如下图,

    想说把 word 中的文本 能够识别出题干跟选项还有答案、大家伙有什么好的方法吗?

    刚开始我想的是用正则匹配、可是关键字只能匹配到哪一行,却无法匹配到上下文。

    现在想达到这么个效果,就是已知一份 word 版考题,需要程序识别出题目,对应的选项以及答案、有好的方法、或思路请赐教。如果有现成的轮子更好,去观摩学习一下!🙏🙏
    11 replies    2019-03-15 10:54:04 +08:00
    mscststs
        1
    mscststs  
       Mar 14, 2019
    ruicky
        2
    ruicky  
    OP
       Mar 14, 2019 via iPhone
    loading
        3
    loading  
       Mar 14, 2019 via Android   ❤️ 1
    答案如下图:
    ruicky
        4
    ruicky  
    OP
       Mar 14, 2019 via iPhone
    ![02846D1B-6BD6-4F07-A787-3EC37E25081F.png]( https://i.loli.net/2019/03/14/5c8a65d66ce80.png)
    ruicky
        5
    ruicky  
    OP
       Mar 14, 2019 via iPhone
    @mscststs
    汗 贴图 好难
    iVeego
        6
    iVeego  
       Mar 14, 2019 via Android
    少数派出过一个教程,把 word 题目做成 excel 表格,你检索下。
    ruicky
        7
    ruicky  
    OP
       Mar 14, 2019 via iPhone
    @iVeego 好的 我去查一下
    merpyzf
        8
    merpyzf  
       Mar 14, 2019 via iPhone
    最重要的还是先把数据规整成统一的格式,不然真不知道代码该怎么写!
    caomu
        9
    caomu  
       Mar 14, 2019 via Android
    语文有点难,如果是纯客观题、选择题这种还好考虑。。。
    正则应该不是好的方向。
    Kylinsun
        10
    Kylinsun  
       Mar 15, 2019 via iPhone
    先把 word 转成 html,定一个规则,读 html 的标签获取内容。
    mscststs
        11
    mscststs  
       Mar 15, 2019
    word 转 html 可行,但是其实最关键的应该还是对于内容,不同题目间应该有固定格式来拆分,同一题目里面也有固定格式可以分辨题目内容和答案。这样才方便写代码解决。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1136 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 23:04 · PVG 07:04 · LAX 16:04 · JFK 19:04
    ♥ Do have faith in what you're doing.