V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
anlitechnet
V2EX  ›  程序员

DeepSeek V4 这周会出吗?

  •  
  •   anlitechnet · 3 小时 18 分钟前 · 3534 次点击

    国产模型是不是要崛起了

    79 条回复    2026-04-23 11:46:06 +08:00
    wangchengwu
        1
    wangchengwu  
       2 小时 57 分钟前   ❤️ 7
    是要崛起了,宇宙第一,然后分你一个亿
    Sundayz
        2
    Sundayz  
       2 小时 51 分钟前
    以现在 deepseek 的研发投入和状态,不要对新模型抱有太大期望。
    cairnechen
        3
    cairnechen  
       2 小时 48 分钟前
    ...就算不懂技术也要懂政治啊,DeepSeek V4 做不到 SOTA 是不会发布的,这都想不明白吗?
    zx9481
        4
    zx9481  
       2 小时 48 分钟前   ❤️ 26
    @wangchengwu 为什么要这样阴阳怪气呢?
    sentinelK
        5
    sentinelK  
       2 小时 44 分钟前
    deepseek 之前出圈,主要还是因为走的是最优性价比路线。和其他模型厂商的差异化足够明显。
    而且发布的时机选择,无论是技术角度上,还是宣发角度上都堪称完美。

    新模型要想达到之前 V3 的宣传高度不容易。
    最起码裸模型得有 claude sonnet 同时期的统计学能力,然后成本还比 sonnet 低很多才有可能。

    还有一个思路,就是目前国产 LLM 的工程化实现,或者说产品化还没有特别出圈的。如果有一个足够惊艳的产品化实现,尤其是在 cc 已经泄露的前提下,有可能是下一个爆点。
    fuhanfeng
        6
    fuhanfeng  
       2 小时 44 分钟前


    感觉今天晚上就要发了
    mingtdlb
        7
    mingtdlb  
       2 小时 43 分钟前   ❤️ 4
    当他适配华为芯,在短期来看或者说放在全球来看,就不会崛起
    Vaspike
        8
    Vaspike  
       2 小时 41 分钟前
    依旧 deepdelay
    catazshadow
        9
    catazshadow  
       2 小时 41 分钟前 via Android   ❤️ 1
    捂嘴自己干掉训练语料,不可能的
    kiracyan
        10
    kiracyan  
       2 小时 36 分钟前
    下周回国
    systemGuest
        11
    systemGuest  
       2 小时 33 分钟前
    @mingtdlb deepseek 是政治任务,和鸿蒙系统一样,好不好用不重要,重要的是面子,全球崛不崛起不知道,但是国内一定会崛起。
    junwind
        12
    junwind  
       2 小时 33 分钟前
    @mingtdlb 哥们儿,这是 zz 任务,中国芯片如果大家都不用,那就只能看漂亮国的脸色。就像电车,这是国策,跟别的都没关系。
    andlp
        13
    andlp  
       2 小时 30 分钟前
    deepseek 主要还是适配国产芯片吧 是一个标杆
    andlp
        14
    andlp  
       2 小时 29 分钟前   ❤️ 2
    @wangchengwu 阴阳怪气什么呢?难道美国能给你分钱?美国佬以前对印第安人是 50 刀买他们一张头皮,对你也只会用 50 刀买一张你的头皮
    skuuhui
        15
    skuuhui  
       2 小时 22 分钟前   ❤️ 2
    deepseek 目前有在商业落地并成功的案例吗? 有啥 ai 应用的是 deepseek 。纯搞笑的项目不算
    gaooo
        16
    gaooo  
       2 小时 21 分钟前
    @andlp 幻想太严重了,建议重新训练
    wat4me
        17
    wat4me  
       2 小时 20 分钟前   ❤️ 1
    @wangchengwu DeepSeek 的 API 价格算低的了,这么喜欢用贵的大模型?还是贵的大模型给你发钱了
    gaooo
        18
    gaooo  
       2 小时 20 分钟前   ❤️ 2
    @junwind ds 都成国家 zz 任务了?太能幻想了,了解下其他的国产模型行不,哪个不甩 ds 几条街
    nicoSword
        19
    nicoSword  
       2 小时 16 分钟前   ❤️ 21
    为什么感觉大伙儿对 DeepSeek 有什么仇恨,深度求索这公司本身一不搞炒作二不发广告,只搞技术,网页和 app 都是清清爽爽的,api 价格也便宜,虽然 v3.2 模型能力放现在不算突出,但它有什么值得恨的地方吗?
    heftyMan
        20
    heftyMan  
       2 小时 14 分钟前
    deepseek 感觉有点落后了
    yangyaofei
        21
    yangyaofei  
       2 小时 10 分钟前   ❤️ 1
    这周各种传言太多了...多的都有点假了...

    貌似现在的说法已经从周一左右的多模态变成纯文本模型了, 现在就希望他们到时候价格和 TPS 都好一点
    yangyaofei
        22
    yangyaofei  
       2 小时 10 分钟前
    @nicoSword #19 因为那些人是 "凡是 XX 的我就要 XX" , 不会就事论事的讨论
    junwind
        23
    junwind  
       2 小时 8 分钟前
    @gaooo 其他家的哪个会去主动用国产卡的。
    bannetlee
        24
    bannetlee  
       2 小时 7 分钟前   ❤️ 2
    deepseek 已经不是一个技术产物了,现在是一个政治筹码
    gaooo
        25
    gaooo  
       2 小时 6 分钟前
    @junwind deepseek 用国产卡了?信我是秦始皇还是自媒体?
    Miaosful
        26
    Miaosful  
       2 小时 2 分钟前
    差不多这两天了吧
    CarryOnHxy
        27
    CarryOnHxy  
       1 小时 59 分钟前
    @mingtdlb 如果就像老黄说的,不用 CUDA ,中国模型跑中国芯,确实对英伟达冲击挺大的
    Danswerme
        28
    Danswerme  
       1 小时 55 分钟前
    Deepseek 到底有什么黑料? 我看 X 和本站很多人都在嘲讽,这公司干什么坏事情了吗?
    Yukiteru
        29
    Yukiteru  
       1 小时 55 分钟前
    deepseek 拿来做翻译还是不错的,性价比很高(如果有别的性价比更高的模型也欢迎推荐)
    至于崛起不崛起的还是算了吧,我一点都不在乎谁崛起
    zzh1224
        30
    zzh1224  
       1 小时 39 分钟前   ❤️ 9
    用跟大国泥腿子+爱国绑定的 deepseek 岂不是玷污自己,当然得踩一脚才能显出自己中产小资特有的高人一等
    tomcrowley
        31
    tomcrowley  
       1 小时 33 分钟前
    出不出的有啥影响
    不会真有人用吧
    dingawm
        32
    dingawm  
       1 小时 29 分钟前
    @Danswerme #26 X 上我倒很少看到有人嘲讽 DeepSeek ,不少外国人都挺期待的,但是不少人也预期这次可能没有那么大的提升。也有可能是因为我刷到的基本都是英文推
    kulove
        33
    kulove  
       1 小时 29 分钟前 via Android
    希望把价格打下来
    tunggt
        34
    tunggt  
       1 小时 28 分钟前
    @Danswerme 和华为一样,崛起戳了非基本盘们的肺管子。
    当然你也可以说它们无耻,用 openai 蒸馏,却自称完全自主研发。不过知识产权这东西,在国内从不是问题。华为不一样自主研发了安卓,不一样是民族骄傲。
    encro
        35
    encro  
       1 小时 27 分钟前   ❤️ 1
    @sentinelK

    1 ,推理流程可视化: 引起行业内行业外震惊,带动了推理和模型的发展,相当于苹果系统之与手机;

    2 ,MoE (混合专家模型):一个问题只激活“部分专家网络”,而不是整个模型,类似“分科医生看病”,不是所有医生一起上;

    3 ,极致成本控制: 让中国厂商不被卡脖子,缩短差距。

    4 ,国产芯片适配: 在原来芯片生态杀出血路,实现中国芯片弯道超车梦想。



    以上,无论哪一样都是举足轻重,为中国大模型和芯片发展的贡献都无法被忽略。


    所以,并不是宣传做得好,也不是时间卡得好,是实实在在的恰到好处贡献。
    KiriGiri
        36
    KiriGiri  
       1 小时 25 分钟前
    deepseek 的竞争力就是 3 块钱 1M token ,如果出来新模型价格不变,或者象征性加一点价格,那就直接用爆。
    sxw11
        37
    sxw11  
       1 小时 24 分钟前
    浙文互联已经涨停了 我们的消息速度还是太慢了 难受
    ybybwdwd
        38
    ybybwdwd  
       1 小时 23 分钟前
    @skuuhui 最近特斯拉不是接入 ds+豆包吗,当然效果咋样我就不知道了
    MoonShot
        39
    MoonShot  
       1 小时 22 分钟前
    ds 刚出来那会让纳指权重股跌了太多了,这实实在在伤了非基辈们的利益了吧🐶
    后来居上的 kimi,qwen,minimax,glm 都没这么恨的
    yanqiyu
        40
    yanqiyu  
       1 小时 21 分钟前
    只要不彻底拉了,价格不要 x10 ,那 deepseek 新模型就是日常任务的神
    unclejoker
        41
    unclejoker  
       1 小时 18 分钟前
    @nicoSword 因为他是国产,这就是最大的原罪
    Nzelites
        42
    Nzelites  
       1 小时 18 分钟前
    v4 就算出了肯定也不算最好 不过尽力适配国产芯片也算是打破垄断的一点努力吧 至于这么恨吗?
    encro
        43
    encro  
       1 小时 18 分钟前
    我对 ds 的期望:

    1 ,有差不多 gpt 5.4 的能力,暂时没有也没有关系,慢慢有就行了;
    2 ,保持现在的价格不升;
    3 ,带动国产芯片实现中国产业链,不再需要翻墙去用 gpt 和 claude ;
    june4
        44
    june4  
       1 小时 17 分钟前
    期待再次雄起
    哪怕水平和别的国产一致,只要容量和价格有优势也是大杀器,不知道适配国产卡对达成这个有没有加成
    c0nstantien
        45
    c0nstantien  
       1 小时 16 分钟前
    @zx9481 因为它是非基辈
    tobepro
        46
    tobepro  
       1 小时 16 分钟前
    @tunggt 蒸馏这事也不好说无耻把,哪家没蒸馏过?天下乌鸦都是一般黑
    c0nstantien
        47
    c0nstantien  
       1 小时 16 分钟前
    @wangchengwu 转人工
    JoeDH
        48
    JoeDH  
       1 小时 14 分钟前
    去年一开始就该融资了,让核心成员看不到希望被人挖跑了。
    感觉梁有点太理想主义 或者说自我,不融资进来给员工加钱 不加大力度买算力,怎么出成果
    gaooo
        49
    gaooo  
       1 小时 13 分钟前
    @nicoSword deepseek 绝对是一家纯粹的技术公司,大伙并不是对 deepseek 仇恨,主要是假消息太让人讨厌了,满怀期待结果一次次落空
    jackyli1
        50
    jackyli1  
       1 小时 11 分钟前
    又要赢麻了
    kpprotector
        51
    kpprotector  
       1 小时 9 分钟前
    @tunggt 蒸馏是啥都不知道,一天到晚在那“蒸馏”。
    蒸馏直接输出的是数据,模型架构蒸馏不出来的。
    deepseek R1 出来之前 O1 输出的思维链都是假的,蒸馏啥呢……
    woctordho
        52
    woctordho  
       1 小时 2 分钟前 via Android
    @mingtdlb 你说的“全球”大概是北美加欧洲吧,然而中国的人口比北美加欧洲还多
    germain
        53
    germain  
       1 小时 2 分钟前
    刚离职的公司有几个业务背后都是 DeepSeek ( Azure AI Foundry ),跑了一年了,一直挺好。

    DeepSeek 是我用过最省心的 AI 提供商,没有之一,知道它的能力边界,适配合适的任务和应用,从来没失望过。
    mightybruce
        54
    mightybruce  
       1 小时 2 分钟前
    deepseek 现在就是带着政治任务, 况且还能吸引一堆小粉红和无脑粉,反感 deepseek 的无脑粉丝,其本身的确有特色。

    deepseek 很多技术人才早就去了小米,字节跳动等公司。

    现在 deepseek 除了能贡献学术论文以外, 不上市直到现在才融资就不要报什么希望吧, 多模态大模型早就难产了。
    sharpy
        55
    sharpy  
       1 小时 1 分钟前
    deepseek 太研究型了,现在 kimi glm 的模型架构都是基于 ds ,比 ds 的 v3 搞得更大,更 scale ,后训练更猛,都搞出了这么多成绩,如果 ds 在去年爆火的时候直接融资,然后一路狂飙,现在不可想象。

    但现在也不算迟,他们只要真能走通他们发表的论文里的那些方案,也不算迟。
    yuyisuo
        56
    yuyisuo  
       59 分钟前
    1 楼看来是拿到 Anthropic 的一亿了,还他妈是美刀,羡慕
    mightybruce
        57
    mightybruce  
       55 分钟前
    国内无脑粉和傻叉自媒体天天吹 deepseek, 结果没出,打了他们脸面
    别在说什么国内大模型都是学 deepseek 的,MOE 根本提出的不是 deepseek, 最早提出的法国的 AI 公司 mistral ai

    国内 kimi 不是 MOE 好吧,是线性注意力,我天天看着这些 deepseek 粉丝真是闲得蛋疼,每天都是 deepseek 第一,打破了 XXX, 我都怀疑是不是中宣部派来的。
    TonyMontana
        58
    TonyMontana  
       53 分钟前
    下楼做”核算“了
    kpprotector
        59
    kpprotector  
       51 分钟前
    deepseek 走的是性价比路线,即便现在模型能力都难达到二流水准,但这个月 Openrouter 的用量还是稳居前三。
    而且 deepseek 在 Role Play 这个类别里常年保持第一,我有时候都怀疑这属于 deepseek“幻想”严重的某种优势了。

    不过现在 deepseek 的新闻真的懒得看了(即便现在 v4 似乎真的要出了),从去年 12 月开始营销号就反复刷 v4 的新闻,看的都让人想吐了。
    bc1
        60
    bc1  
       46 分钟前
    deepseek 企业端调用的很多呀,为啥会觉得没人用呢,不会是觉得只有敲代码和养龙虾才用 AI 吧。。。。
    foolherb
        61
    foolherb  
       45 分钟前
    昇腾+v4 ;难度是比较高
    wxm
        62
    wxm  
       44 分钟前
    trae 配置 deepseek-reasoner 生成的代码很难评
    kpprotector
        63
    kpprotector  
       40 分钟前
    @nicoSword 到目前为止 deepseek 本身倒是没啥问题,模型也是该用就用,但是营销号整天“赢赢赢”太烦了。
    K0ma
        64
    K0ma  
       38 分钟前
    层主搞个水文博得了流量,只剩下评论区网友们吵得不可开交。
    justfindu
        65
    justfindu  
       38 分钟前
    deepseek 本身没啥问题, 理论和实现都得到了认可. 但是现在又要搞完全适配昇腾. 感觉很难啊.
    br9852000
        66
    br9852000  
       37 分钟前   ❤️ 1
    看这评论意思是要直接投降?你投降,人家也不让你用 gtp 、Claude 、gemini 。有点骨气吧,一天到晚殖里殖气。好像自己站在对的一面。人家理你吗?做狗人都收你。贱不贱
    vipfts
        67
    vipfts  
       37 分钟前
    @nicoSword deepseek 一出美股就大跌,你说呢
    svtter
        68
    svtter  
       34 分钟前
    deepseek 没发,k2.6 和 mino-v2.5-pro 发了。还有 qwen3.6 27B ,太猛了。
    irvinghua
        69
    irvinghua  
       33 分钟前
    程序员的现状不就是全体戴上面具,跪在地上,双手捧着钱递给 A 厂,A 厂还要时不时抽查面具戴没戴好,没戴好就反手拿起钱抽程序员们一个大嘴巴子。被抽了一声都不敢吭,还得忍。就这样状态了,有解放者的希望来了,居然还有人喝倒彩。
    HomeZane
        70
    HomeZane  
       30 分钟前
    @encro #43 除了 3 前两个是不是要求太高了
    tunggt
        71
    tunggt  
       28 分钟前 via Android
    @tobepro 主要是爱国绑架,然后又宣传完全自主研发。
    本身不是问题,但你学华为宣传完全自主研发就下作了
    hlayk
        72
    hlayk  
       22 分钟前
    @br9852000 有些人就是贱骨头
    stormsuncc
        73
    stormsuncc  
       22 分钟前
    成天幻想 zz 任务呢
    gibber
        74
    gibber  
       22 分钟前
    对于有些人来讲,国产就是原罪。
    jhdxr
        75
    jhdxr  
       20 分钟前
    @vipfts
    @MoonShot
    给缅 A 的基本盘韭菜们一点小小的科普,美股是可以做空的,意思是下跌一样可以赚钱
    encro
        76
    encro  
       18 分钟前
    @HomeZane

    可能顺序是要先实现 3 ,才能实现 1 和 2.

    推理的原理和流程是一样的,主要是数据和架构算法了。

    如果实现 3 ,那么 1 和 2 就不远了。
    june4
        77
    june4  
       17 分钟前
    @tunggt 说说 ds 是怎么搞爱国绑架的?抓着你 jj 逼你用了?那 anthropic 搞中国人与狗不能用又算什么
    cfancc
        78
    cfancc  
       13 分钟前
    不出所料看到一群汪汪队,欧美人喂的狗粮还真是好。伊朗的网络设备刚被留的硬件后门废掉了,Deepseek 的意义就在于不用面对这种情况
    ccpp132
        79
    ccpp132  
       9 分钟前
    没那么多鸟事,现在卡芯片进口,国内算力普遍不足,基本上家家都在国内外芯片混用
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4934 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 151ms · UTC 03:55 · PVG 11:55 · LAX 20:55 · JFK 23:55
    ♥ Do have faith in what you're doing.