davidyin
40.35D
12.71D
V2EX  ›  Local LLM

配置 kiro 的问题

  •  
  •   davidyin · 16h 16m ago via Android · 1302 views
    接上回 https://v2ex.com/t/1211566#reply82

    在 PC A 上,装了 Ubuntu 24.04,用的是 rx6800xt 16G 显卡,ollama 装上了,open-webui 也装上了。

    从 PC B ,我的桌面电脑 Windows 上访问呢,可以在浏览器里面打开 open-webui ,访问都正常。

    现在困扰我的是如何配置 kiro ,使其能使用 PC A 上的 ollama ( qwen2.5-coder:7b ),作为 agent ,辅助编程。现在这里总是不行。

    向做成功的朋友请教
    20 replies    2026-06-16 00:00:16 +08:00
    kite12580
        1
    kite12580  
       15h 56m ago
    为啥选 kiro ?其他工具生态更好吧,而且大部分都能直连 ollama
    xueyangkk
        2
    xueyangkk  
       15h 56m ago
    qwen2.5-coder:7b 这个模型 能辅助? 你费这个劲干啥 KIRO 价格也不高 200 刀 够你用了
    tengxun
        3
    tengxun  
       15h 38m ago
    kiro 免费送我一个月,我都懒得用 不好用啊
    davidyin
        4
    davidyin  
    OP
       15h 29m ago via Android
    @kite12580
    只用过 kiro 和 vscode ,有什么好建议?


    @xueyangkk
    @tengxun
    用过 kiro 的,它提供的 ai 够我用的了。


    只是现在要换成本地 llm 。
    GaGim
        5
    GaGim  
       15h 27m ago
    @tengxun 哈哈没错,白送都不要
    tengxun
        6
    tengxun  
       15h 13m ago
    @davidyin 可以让大模型帮你写个工具或者直接帮你修改配置. 你用过 trae 吗 完全免费的 还有付费就直接 deepseek v4 pro 或者 flash + reasonix 啊
    tengxun
        7
    tengxun  
       15h 13m ago
    本地模型非常弱智,根本没法用
    Uplay
        8
    Uplay  
       14h 8m ago
    @GaGim 感觉 kiro 的模型勉强可以用啊还能用 claude-opus-4.8
    Uplay
        9
    Uplay  
       14h 7m ago
    @tengxun #3 感觉 kiro 可以用啊还能用 claude-opus-4.8
    SethShi
        10
    SethShi  
       12h 13m ago
    @Uplay 别人回复你的是本地模型,你这个想要用本地模型只接总 vscode 最开放
    oldlamp
        11
    oldlamp  
       11h 58m ago
    如果是本地模型,可以考虑 Qwen3.5 、Qwen3.6 之类的,2.5 太老了。
    davidyin
        12
    davidyin  
    OP
       11h 49m ago via Android
    @oldlamp

    哪个模型都无所谓,先得有哪位能教我一下,如何把这条路给打通。如果能走通,换个模型还不是很容易,只要 16G 显存能支持,ollama 能支持,就可以可用了。

    问题是我怎么设置都不行啊
    wmwmdtt
        13
    wmwmdtt  
       10h 12m ago
    @davidyin cc 就 ollama 官网一句话:ollama launch claude --model qwen2.5-coder 。但是用 codeagent 的话,32k 的上下文,几轮对话就没了。 我 4070st 也是 16g 显存,刚开始也像你那样以为能跑模型就够了,但是好像上下文的什么 kv 也占用显存的。折腾过 opencode 和 cc 的,最后放弃本地模型做 coding 了。
    oldlamp
        14
    oldlamp  
       9h 24m ago via Android
    @davidyin


    https://mp.weixin.qq.com/s/6wIdqUgz2oJ8p2bosbkQfA

    或许可以参考这类的指南,换一个 opencode 之类的工具呢?
    oldlamp
        15
    oldlamp  
       9h 23m ago via Android   ❤️ 1
    你用第一台电脑的地址,以及它打开的端口,参考欧拉玛的那个配置,对外网局域网开放端口,然后在第二台机器上按照 open AI 的 API 格式输入你上边第一台机器的地址和端口,这样应该就能按照 open AI 的 AP AI 的方式来连接上了,这过程中的 API k 可以自己随意设置的。
    jetsung
        16
    jetsung  
       9h 16m ago
    https://docs.ollama.com/api/openai-compatibility

    OpenAI 兼容模式接入。
    ~/.config/kilo/opencode.json

    {
    "$schema": "https://app.kilo.ai/config.json",
    "provider": {
    "llama": {
    "name": "Ollama Custom",
    "id": "ollama",
    "npm": "@ai-sdk/openai-compatible",
    "models": {
    "qwen2.5-coder:7b": {
    "id": "qwen2.5-coder:7b",
    "name": "qwen2.5-coder:7b",
    "family": "ollama"
    }
    },
    "options": {
    "apiKey": "ollama",
    "baseURL": "http://localhost:11434/v1/"
    }
    }
    }
    jetsung
        17
    jetsung  
       9h 9m ago
    再补充一下:

    环境变量:
    OLLAMA_HOST=0.0.0.0:11434 OLLAMA_ORIGINS=* ollama serve

    环境变量的说明: https://docs.ollama.com/faq
    davidyin
        18
    davidyin  
    OP
       8h 2m ago via Android
    @jetsung

    谢谢指导,我去试试看。
    davidyin
        19
    davidyin  
    OP
       8h 1m ago via Android
    @wmwmdtt
    这一句指令,是都在一台电脑上才行。我这是两台电脑。
    coefu
        20
    coefu  
       1h 55m ago
    我记得你之前 3 月份不是问过一样的问题吗? 3 个月了还没搞定?我都和你说了 Cline+vscode ,Cline 填 ollama 都 openAI api 就行了。哥们儿,有点儿菜了啊。

    问 ChatGPT 也就是 1 分钟到事情。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1164 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 76ms · UTC 17:56 · PVG 01:56 · LAX 10:56 · JFK 13:56
    ♥ Do have faith in what you're doing.