voidnode
V2EX  ›  OpenClaw

openclaw 无法多模态输入图片识别

  •  
  •   voidnode · Feb 8 · 1672 views
    This topic created in 93 days ago, the information mentioned may be changed or developed.

    我用 Telegram 的,我尝试过发送图片识别错误 我换了两次模型,一开始是 kimi k2.5 ,后面换了 gemini 3 flash 都不行 每次都是乱回答图片内容 我尝试图片 url 是可以的,那说明模型是没问题的,我猜测是只发送了一个文件名过去了? 有什么解决办法吗?我写了个 skill ,他还是执着使用 read 去读取

    3 replies    2026-02-10 08:29:08 +08:00
    rolandzhou
        1
    rolandzhou  
       Feb 9 via iPhone
    我的是 tg + gemini 3 pro/claude-sonnet-4-5 ,没有做额外配置,开箱就能直接发图片过去,它也能理解图片的内容
    Watchdog
        2
    Watchdog  
       Feb 9
    gemini 完全可以,直接发,语音、图片都可以,就是慢
    liverpool17
        3
    liverpool17  
       Feb 10
    读取图片路径不对,我一开始也是你这样后来跟模型说清楚让他自己查找位置修改位置就好了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3786 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 05:04 · PVG 13:04 · LAX 22:04 · JFK 01:04
    ♥ Do have faith in what you're doing.