openclaw 无法多模态输入图片识别

This topic created in 93 days ago, the information mentioned may be changed or developed.

我用 Telegram 的，我尝试过发送图片识别错误我换了两次模型，一开始是 kimi k2.5 ，后面换了 gemini 3 flash 都不行每次都是乱回答图片内容我尝试图片 url 是可以的，那说明模型是没问题的，我猜测是只发送了一个文件名过去了？有什么解决办法吗？我写了个 skill ，他还是执着使用 read 去读取

图片

模型

识别

3 replies • 2026-02-10 08:29:08 +08:00

rolandzhou

Feb 9 via iPhone

我的是 tg + gemini 3 pro/claude-sonnet-4-5 ，没有做额外配置，开箱就能直接发图片过去，它也能理解图片的内容

Watchdog

Feb 9

gemini 完全可以，直接发，语音、图片都可以，就是慢

liverpool17

Feb 10

读取图片路径不对，我一开始也是你这样后来跟模型说清楚让他自己查找位置修改位置就好了