sqshanyao
V2EX  ›  Local LLM

求可靠本地 vibe coding,有八卡的 L20 服务器

  •  
  •   sqshanyao · Apr 15 via Android · 981 views
    This topic created in 50 days ago, the information mentioned may be changed or developed.
    有一台八卡 llgpu 服务器,想搞一个本地 AI 编码,求可靠方案
    coefu
        1
    coefu  
       Apr 16
    unsloth/Qwen3.5-397B-A17B-GGUF, UD-Q6_K,327G,留 50G 跑 context ,看情况;如果 context 不够,就换 UD-Q4_K_XL ,245G ,留 130G 跑 context ,肯定够的。

    IDE 用开源的 continue 即可。想完全 agent ,估计够呛,你自己得盯着。local 的能力肯定不如云端 api 的。
    coefu
        2
    coefu  
       Apr 16
    先试 llama.cpp 的 8 卡 tensor parallel 。反正一年前的 8 卡 TP 模式,是有点问题的,不知道修复没有。如果不行,就上 vllm 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1013 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 22:29 · PVG 06:29 · LAX 15:29 · JFK 18:29
    ♥ Do have faith in what you're doing.