V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lifehz
V2EX  ›  Apple

mac air m1 能搭 deepseek v3 吗?

  •  
  •   lifehz · 15 天前 · 3301 次点击

    有人试过么?

    20 条回复    2025-01-06 07:39:27 +08:00
    0x2CA
        1
    0x2CA  
       15 天前
    Ollama 还没有上 v3 ,最高 deepseek-v2.5 ,而且依照要求内存要求很高,只能运行入门款,效果也不好
    wangshushu
        2
    wangshushu  
       15 天前
    别说 M1 ,M4 也搞不定啊,那可是 671B !激活参数 37B ,算力应该是够了,内存远远远远不够,拉倒顶配也不够
    neteroster
        3
    neteroster  
       15 天前 via Android
    想多了,Q4 都要几百 G 内存
    LeeEnzo
        4
    LeeEnzo  
       15 天前   ❤️ 1
    ...api 便宜直接调用 api
    goodblue
        5
    goodblue  
       15 天前
    你真的知道 V3 是啥吗?
    TimPeake
        6
    TimPeake  
       15 天前
    好像需要 64GRAM/GPU A100 起步
    JeffreyZhuang
        7
    JeffreyZhuang  
       15 天前   ❤️ 3
    8 台 64G 的 mini 可以,老外已经实验过了 :aHR0cHM6Ly9ibG9nLmV4b2xhYnMubmV0L2RheS0yLw==
    joequan
        8
    joequan  
       15 天前
    不太可能,671B ,内存就要将近 1t ,就算勉强运行,速度贼慢,也没有用处
    erxiao
        9
    erxiao  
       15 天前
    很难。而且本地模型效果和在线的差太远了。运行的机器都不一样,不管是 M 系列芯片还是 4090 ,都是民用级别,不是 A100 这种工业级别的
    otakustay
        10
    otakustay  
       15 天前
    V3 要 20 块 80G 显存的 A100 才能部署,个人电脑就别想了
    lifehz
        11
    lifehz  
    OP
       15 天前
    @LeeEnzo 好的,那就调用 api 吧
    lifehz
        12
    lifehz  
    OP
       15 天前
    确实没弄明白 deepseek v3 ,如果号称最省资源的都要这么多资源,那是没机会玩本地模型了
    spike0100
        13
    spike0100  
       15 天前
    2.5 都跑不起来。2 的 3b 模型效果一般。
    YooboH
        14
    YooboH  
       15 天前
    @lifehz 他是训练省资源,但是这个模型本身就很大,而且只放出了 600 多 b 版本的,所以你本地部署的内存要求很高。你要想本地部署可以用那些 7b 、13b 版本的,但是效果大概不咋样
    mumbler
        15
    mumbler  
       15 天前
    gpt4o-mini 只有 8B 参数,意味着以后本地能跑 gpt4o-mini 模型,能力足够了,10B 以上模型都是服务器集群用的
    woorz
        16
    woorz  
       15 天前
    @lifehz 是说训练它省资源。不是它省资源。用 api ,不需要显卡
    lifehz
        17
    lifehz  
    OP
       14 天前
    对了,为什么提这个问题,是因为机器之心 昨天发的文章
    https://mp.weixin.qq.com/s/ac3E1roCv8uSVYVKZ84E1w

    第二条是这么说的:
    一些 GPT-4 级模型可以在笔记本电脑上运行

    想了一下,似乎 “可以在笔记本电脑上运行” 和 “搭 deepseek v3” 不是一回事,但我的意思还是 “运行” gpt-4 级模型


    尤其是 deepseek v3 出来大火后,更好奇想了解能不能在我的 mac air m1 上运行了
    lrigi
        18
    lrigi  
       14 天前 via iPhone
    @mumbler 4o-mini 他们也只是估测,说不定是个 8b*100 的专家模型
    ShadowPower
        19
    ShadowPower  
       14 天前
    @mumbler GPT-4 之后的模型 OpenAI 官方已经不公布参数量了,只是网友根据生成速度来推测的……
    只能说激活的参数量是 8B ,但是每次输出时激活的是模型中不同部分的 8B 。

    就像 DeepSeek V3 的激活参数量有 32B ,而整个模型有 671B 一样。
    flyws
        20
    flyws  
       12 天前
    Deepseek v2.5 或者 Qwen 这些目前本地更有戏,这些在排行榜上我记得都接近老的 GPT-4 ,不过即使 Q4 的话大概都需要 8 ~ 10G 内存,所以其实现在 Macbook 统一显存内存后,运行 LLM 最大的卡点还是到底有多少内存,想玩遍主流各种大模型的话,最好还是拉满 128G ,至少也得有个 16G ,不然大多数模型都跑不起来。

    本地跑 LLM inference 还是很有意思的,比如高铁或者飞机上想写点代码但是网络不稳定,那本地有个 Deepseek 2.5 级别的编程助手已经是很提升效率了。

    建议楼主可以下载个 LM Studio https://lmstudio.ai ,方便自己开始研究实操这些
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2942 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 06:59 · PVG 14:59 · LAX 22:59 · JFK 01:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.