V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
zhwguest
V2EX  ›  程序员

deepseek 的源代码开源在哪里啊?

  •  
  •   zhwguest · 1 天前 · 1879 次点击

    想拿来膜拜一下,V3 和 R1 的。还有量化方案也在里面么?

    20 条回复    2025-01-27 22:41:07 +08:00
    Suger828
        1
    Suger828  
       23 小时 0 分钟前
    没有开源源代码 ,只有论文,你去复现吧
    dajj
        2
    dajj  
       14 小时 26 分钟前
    好像是模型免费下载, 国产就是善于创造概念,这么算 gimmy 也是开源的
    zenghx
        3
    zenghx  
       14 小时 20 分钟前 via iPhone
    zlowly
        4
    zlowly  
       14 小时 0 分钟前
    xycost233
        5
    xycost233  
       13 小时 49 分钟前   ❤️ 4
    @dajj ?第一次听说大模型领域模型开源不算开源的,模型结构都给你了还要咋样
    Felixchen1062
        6
    Felixchen1062  
       13 小时 22 分钟前
    感觉 LLM 模型之类的开源,不等同于工程项目的开源
    好比我写了一篇文章,允许随意使用,但我也不需要提供字/词典吧,LLM/CV 模型训练更像是一个 cooking 的过程,食谱,食材都端上来了,毕竟它不像是一个工程项目。
    至于楼上那位国产创造概念的观点,我不太清楚 llama 开源是不是也是这种形式,可以考证一下
    CynicalRose
        7
    CynicalRose  
       12 小时 59 分钟前
    llama3 的代码仓库: https://github.com/meta-llama/llama3 ,虽然我到现在都没跑起来

    deepseek 的仓库没有代码的: https://github.com/deepseek-ai/DeepSeek-R1 ,v3 还没试: https://github.com/deepseek-ai/DeepSeek-V3
    iorilu
        8
    iorilu  
       12 小时 58 分钟前
    大部分模型所谓开源就是指训练好的模型权重开源, 反正你直接可以用

    但不会告诉你怎么训练出来的, 更不会给你训练材料
    CynicalRose
        9
    CynicalRose  
       12 小时 57 分钟前
    @CynicalRose LLM 的开源多数只提供 inference 的代码,想训练只能自己尝试复现了。
    dajj
        10
    dajj  
       12 小时 34 分钟前   ❤️ 1
    @xycost233 我也是第一次听说,没有代码也叫开源的
    yanggb
        11
    yanggb  
       12 小时 2 分钟前
    @dajj LLM 领域目前是这样的,DeepSeek 以 MIT 协议开源了模型权重,附赠实现论文,已经让 AI 研究者激动,甚至有人已经复现了: https://github.com/hkust-nlp/simpleRL-reason/tree/main
    c0nstantien
        12
    c0nstantien  
       11 小时 58 分钟前
    @dajj 赢!
    nickchenyx
        13
    nickchenyx  
       11 小时 54 分钟前   ❤️ 4
    @dajj 我也是第一次听说 OpenAI 原来是 Close 的
    visitantzj
        14
    visitantzj  
       10 小时 7 分钟前
    汗……还要人家把业务数据、代码都给你才行?要不要再免费搭上能跑得动的 vps
    crackidz
        15
    crackidz  
       7 小时 43 分钟前
    DeepSeek 是训练过程全写到论文里了,你可以根据论文直接复现。https://github.com/huggingface/open-r1
    crackidz
        16
    crackidz  
       7 小时 42 分钟前
    要不怎么说 DeepSeek 是大善人呢
    crackidz
        17
    crackidz  
       6 小时 58 分钟前
    @CynicalRose deepseek r1 的代码就是 v3 的仓库,是同一套代码只是权重不一样。这个 README 里有啊
    csys
        18
    csys  
       6 小时 33 分钟前 via Android
    上次 deepseek v3 出来的时候站里就已经闹过不少笑话了

    现在怎么还这样啥都不懂就信口开河,不长记性吗😅

    动动手问问 llm 也行啊
    AlohaV2
        19
    AlohaV2  
       3 小时 5 分钟前
    SGL
        20
    SGL  
       30 分钟前
    这就说明搞算法的和搞开发的”隔行如隔山“了 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1981 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 15:11 · PVG 23:11 · LAX 07:11 · JFK 10:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.