节点赞助商

cwcc

简单使用了一周在本地 Mac 的 qwen3.6-35b-a3b 模型

  •  
  •   cwcc · Apr 27 · 1475 views

    感觉本地的模型有很大的潜力,但也有局限,主要是受限于硬件吧。以下几点:

    • 除了复杂架构调整分析工作外,日常的 CRUD 开发、项目总结、文档翻译、需求输入和模块的 Bug 修复上,几乎可以替代在线模型。
    • 复杂分析以及深度的问题查找、大上下文还受限于模型规模和内存。
    • 经过豆包和模型自身给出 llm 优化建议,使用 GGUF 模型能跑出 33 token/s 的速度,使用 MLX 能到 38 token/s 。
    • 36G 内存不够,开太大上下文会爆显存,只能重启。

    第一次体会到 Mac 的性能居然这么不够用,搞得都想换 M5 Max 了,但感觉专门为 AI 也不是特别值得。

    6 replies    2026-04-27 09:37:35 +08:00
    cat9life
        1
    cat9life  
       Apr 27
    op 有对比过 gemma4 的近似尺寸模型吗
    strobber16
        2
    strobber16  
       Apr 27 via Android
    这个模型给我最大的惊喜是可以过洗车测试了。虽然不是很稳定
    rockddd
        3
    rockddd  
       Apr 27
    最后悔的就是买 Mac Mini 当时想不出使用场景,没有继续再多加内存,只选配了 32G
    Seanfuck
        4
    Seanfuck  
       Apr 27
    都说 qwen3.6-27b 更好用,可以试试。
    cwcc
        5
    cwcc  
    OP
       Apr 27
    @Seanfuck qwen3.6-27b 在 M3 Pro 的 Mac 上太慢了,不到 8 token/s ,基本不可用。
    cwcc
        6
    cwcc  
    OP
       Apr 27
    @cat9life 只试过 qwen3.6-27b ,但太慢了。gemma4 没试过,有时间摸鱼可以测测。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1126 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 18:04 · PVG 02:04 · LAX 11:04 · JFK 14:04
    ♥ Do have faith in what you're doing.