kisshere
V2EX  ›  Apple

现在哪里还能花最便宜的方式买到正品的 mac(mini|studio) 64GB 的装备?

  •  
  •   kisshere · 5 days ago · 1861 views
    跑本地大模型用,不想要二手
    CNYoki
        1
    CNYoki  
       5 days ago
    Apple 直营店可以买到官翻版
    hello365
        2
    hello365  
       5 days ago
    能跑到多大的模型多少 token/s ?
    sentinelK
        3
    sentinelK  
       5 days ago
    @hello365 目前的话,qwen3.6-27B 4bit 量化的 mlx 版本模型,M5 MAX 128GB 的 macbookpro ,decode 输出可以跑到 30t/s ,prefill 输入可以跑到 700t/s

    如果是 moe 模型,比如 qwen3.6-35B-A3B ,能到 100t/s 的输出。
    my3157
        4
    my3157  
       5 days ago via Android
    实测 M2 Max 64G qwen3.6-35B-A3B nvfp4 ,ollama 大概能跑 70+t/s
    SteveRogers
        5
    SteveRogers  
       5 days ago via iPhone
    @sentinelK 买 mac studio 96g 可以满血跑 qwen3.6 吗
    sentinelK
        6
    sentinelK  
       5 days ago
    @SteveRogers 要等 M5 Max 版本的 studio 出来才行。M4 MAX 的性能比这代低很多,另外,mac 的统一内存是够放满血版本(非量化)的 qwen3.6 27B 的,但是因为内存带宽,所以性能很差。
    kurisu
        7
    kurisu  
       5 days ago
    @my3157 用在什么场景呀,也想跑一个。但是没想好能用在哪。
    my3157
        8
    my3157  
       5 days ago via Android
    @kurisu 拆解小说,把小说拆解成类似剧本的形式
    AllenZ0
        9
    AllenZ0  
       5 days ago
    这个各大都缺货,官翻也没有。我也在蹲。
    nachr
        10
    nachr  
       4 days ago
    本地大模型真要达到好用程度小于 128 都不太够看吧
    oncethink
        11
    oncethink  
       4 days ago
    @nachr 128 不够,256 起步
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5992 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 02:07 · PVG 10:07 · LAX 19:07 · JFK 22:07
    ♥ Do have faith in what you're doing.