配置 kiro 的问题

接上回 https://v2ex.com/t/1211566#reply82

在 PC A 上，装了 Ubuntu 24.04,用的是 rx6800xt 16G 显卡，ollama 装上了，open-webui 也装上了。

从 PC B ，我的桌面电脑 Windows 上访问呢，可以在浏览器里面打开 open-webui ，访问都正常。

现在困扰我的是如何配置 kiro ，使其能使用 PC A 上的 ollama （ qwen2.5-coder:7b ），作为 agent ，辅助编程。现在这里总是不行。

向做成功的朋友请教

20 replies • 2026-06-16 00:00:16 +08:00

kite12580

15h 56m ago

为啥选 kiro ？其他工具生态更好吧，而且大部分都能直连 ollama

xueyangkk

15h 56m ago

qwen2.5-coder:7b 这个模型能辅助？你费这个劲干啥 KIRO 价格也不高 200 刀够你用了

tengxun

15h 38m ago

kiro 免费送我一个月,我都懒得用不好用啊

davidyin

15h 29m ago via Android

@kite12580
只用过 kiro 和 vscode ，有什么好建议？

@xueyangkk
@tengxun
用过 kiro 的，它提供的 ai 够我用的了。

只是现在要换成本地 llm 。

GaGim

15h 27m ago

@tengxun 哈哈没错，白送都不要

tengxun

15h 13m ago

@davidyin 可以让大模型帮你写个工具或者直接帮你修改配置. 你用过 trae 吗完全免费的还有付费就直接 deepseek v4 pro 或者 flash + reasonix 啊

tengxun

15h 13m ago

本地模型非常弱智,根本没法用

Uplay

14h 8m ago

@GaGim 感觉 kiro 的模型勉强可以用啊还能用 claude-opus-4.8

Uplay

14h 7m ago

@tengxun #3 感觉 kiro 可以用啊还能用 claude-opus-4.8

SethShi

12h 13m ago

@Uplay 别人回复你的是本地模型，你这个想要用本地模型只接总 vscode 最开放

oldlamp

11h 58m ago

如果是本地模型，可以考虑 Qwen3.5 、Qwen3.6 之类的，2.5 太老了。

davidyin

11h 49m ago via Android

@oldlamp

哪个模型都无所谓，先得有哪位能教我一下，如何把这条路给打通。如果能走通，换个模型还不是很容易，只要 16G 显存能支持，ollama 能支持，就可以可用了。

问题是我怎么设置都不行啊

wmwmdtt

10h 12m ago

@davidyin cc 就 ollama 官网一句话：ollama launch claude --model qwen2.5-coder 。但是用 codeagent 的话，32k 的上下文，几轮对话就没了。我 4070st 也是 16g 显存，刚开始也像你那样以为能跑模型就够了，但是好像上下文的什么 kv 也占用显存的。折腾过 opencode 和 cc 的，最后放弃本地模型做 coding 了。

oldlamp

9h 24m ago via Android

@davidyin

https://mp.weixin.qq.com/s/6wIdqUgz2oJ8p2bosbkQfA

或许可以参考这类的指南，换一个 opencode 之类的工具呢？

oldlamp

9h 23m ago via Android

你用第一台电脑的地址，以及它打开的端口，参考欧拉玛的那个配置，对外网局域网开放端口，然后在第二台机器上按照 open AI 的 API 格式输入你上边第一台机器的地址和端口，这样应该就能按照 open AI 的 AP AI 的方式来连接上了，这过程中的 API k 可以自己随意设置的。

jetsung

9h 16m ago

https://docs.ollama.com/api/openai-compatibility

OpenAI 兼容模式接入。
~/.config/kilo/opencode.json

{
"$schema": "https://app.kilo.ai/config.json",
"provider": {
"llama": {
"name": "Ollama Custom",
"id": "ollama",
"npm": "@ai-sdk/openai-compatible",
"models": {
"qwen2.5-coder:7b": {
"id": "qwen2.5-coder:7b",
"name": "qwen2.5-coder:7b",
"family": "ollama"
}
},
"options": {
"apiKey": "ollama",
"baseURL": "http://localhost:11434/v1/"
}
}
}

jetsung

9h 9m ago

再补充一下：

环境变量：
OLLAMA_HOST=0.0.0.0:11434 OLLAMA_ORIGINS=* ollama serve

环境变量的说明： https://docs.ollama.com/faq

davidyin

8h 2m ago via Android

@jetsung

谢谢指导，我去试试看。

davidyin

8h 1m ago via Android

@wmwmdtt
这一句指令，是都在一台电脑上才行。我这是两台电脑。

coefu

1h 55m ago

我记得你之前 3 月份不是问过一样的问题吗？ 3 个月了还没搞定？我都和你说了 Cline+vscode ，Cline 填 ollama 都 openAI api 就行了。哥们儿，有点儿菜了啊。

问 ChatGPT 也就是 1 分钟到事情。