V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tomato9
V2EX  ›  程序员

对于传统格式文档, ai coding 工具都是怎么理解的

  •  
  •   tomato9 · Feb 9 · 1653 views
    This topic created in 84 days ago, the information mentioned may be changed or developed.

    比如 excel 写的接口文档,pdf 格式的流程图,word 的需求文档,有哪些 ai coding 工具是可以读取的,我试了下 claude code 是可以的读取,但我又没配置多模态大模型,这里面读取的原理是啥呢

    10 replies    2026-02-09 20:01:44 +08:00
    visper
        1
    visper  
       Feb 9
    也许他们自己的上传文件接口先用工具把文件内容读取转成了 markdown 和图片之类的呢?
    javalaw2010
        2
    javalaw2010  
       Feb 9
    excel/pdf/word 这类文件的读写的技术很成熟了,随便什么语言都能找到对应的 SDK 库,集成进工具里面写成 function 给大模型调用就好了。
    gorvey
        3
    gorvey  
       Feb 9
    通过 MCP 和 SKILL,所有的 ai 都能接入使用
    tomato9
        5
    tomato9  
    OP
       Feb 9
    @gorvey 我主要好奇 pdf 这种里面有流程图的要如何通过 mcp 理解,感觉还是需要多模态能力呀
    tomato9
        6
    tomato9  
    OP
       Feb 9
    @javalaw2010 那可能 word 和 excel 这种已经是内嵌到 claude code 里面的基础能力了
    gorvey
        7
    gorvey  
       Feb 9
    @tomato9 #5 要看源格式,如果是代码写的那就不需要视觉,如果本来就是图片那就需要了
    gorvey
        8
    gorvey  
       Feb 9   ❤️ 1
    @tomato9 #5 https://skillsmp.com/zh/skills/anthropics-skills-skills-pdf-skill-md 你可以看下这个 skill 是怎么写的,如何理解 pdf 里面的内容,这里面都写的很清楚
    tomato9
        9
    tomato9  
    OP
       Feb 9
    @gorvey 谢谢大佬
    aisk
        10
    aisk  
       Feb 9
    claude 的模型好像时支持视觉的: https://platform.claude.com/docs/zh-CN/build-with-claude/vision
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2506 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 61ms · UTC 04:33 · PVG 12:33 · LAX 21:33 · JFK 00:33
    ♥ Do have faith in what you're doing.