V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
wszzh
V2EX  ›  Local LLM

谷歌的 Gemma 4 怎么样,有必须要本地弄一下吗

  •  
  •   wszzh · 22 days ago · 2994 views

    如题,看到好多文章都在说 Gemma 4 。或许私人 AI 助手,是不是要成为标配了?

    19 replies    2026-04-27 11:06:39 +08:00
    herozzm
        1
    herozzm  
       22 days ago via iPhone
    你有显卡吗?
    wszzh
        2
    wszzh  
    OP
       22 days ago
    没有。只有 mac mini
    @herozzm
    luoyide2010
        3
    luoyide2010  
       22 days ago
    32B 参数的吃内存,小参数的作用有限,可能在翻译,OCR ,归类排序之类的比较实用
    zenfsharp
        4
    zenfsharp  
       22 days ago via iPhone
    没必要,不如云端的强大且方便。两个大参数的大概是去年的水平,小参数的是前年的水平。
    wszzh
        5
    wszzh  
    OP
       22 days ago
    看了一下,感觉没必要尝试了🤦
    sickoo
        6
    sickoo  
       22 days ago
    OPENROUTER 的 free Qwen3.6 够用了
    levn
        7
    levn  
       22 days ago
    haiku 的水平
    letsgogogo
        8
    letsgogogo  
       21 days ago
    @levn +1
    skankhunt42
        9
    skankhunt42  
       21 days ago via iPhone
    必须要的,不然开除你地球籍
    joynvda
        10
    joynvda  
       21 days ago
    @wszzh 感觉比 qwen3.5:9b 好

    本人没 mac, intel lunar lake 内置 gpu ,32g ,gemma4:26b 能跑 18tps
    chengtx
        11
    chengtx  
       21 days ago via iPhone
    手机跑了小的本地模型
    洗车难题过关了
    MrMissBlack
        12
    MrMissBlack  
       21 days ago
    @joynvda 兄弟你是安装在 openvino 后端上的吗?我也是 lunarlake ,想试试
    Seck
        13
    Seck  
       21 days ago via Android
    需求?
    nachr
        14
    nachr  
       20 days ago
    24GB macbook 跑不起来
    mingtdlb
        15
    mingtdlb  
       20 days ago
    没有数据安全的需求,还是云比较好

    @sickoo #6 感觉 openrouter 很容易 429
    takpap
        16
    takpap  
       19 days ago
    @nachr 假的吧 我手机都能跑。。。
    azraelrabbit
        17
    azraelrabbit  
       19 days ago
    我的 macmini m4 32G 跑 26b 可以, 20-24 token 每秒.

    32b 的跑不起来, 内存不够.
    longxinglink
        18
    longxinglink  
       19 days ago
    ollama 有免费 Gemma 4 的还能用,nvidia 的不能调用不知道咋回事
    liangyuan1985
        19
    liangyuan1985  
       2h 58m ago
    Qwen3.6-27B 效果还可以。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5868 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 70ms · UTC 06:04 · PVG 14:04 · LAX 23:04 · JFK 02:04
    ♥ Do have faith in what you're doing.