DeepSeek V4 这周会出吗？

DeepSeek

模型

崛起

79 条回复 • 2026-04-23 11:46:06 +08:00

1

wangchengwu

2 小时 57 分钟前

7

是要崛起了，宇宙第一，然后分你一个亿

2

Sundayz

2 小时 51 分钟前

以现在 deepseek 的研发投入和状态，不要对新模型抱有太大期望。

3

cairnechen

2 小时 48 分钟前

...就算不懂技术也要懂政治啊，DeepSeek V4 做不到 SOTA 是不会发布的，这都想不明白吗？

4

zx9481

2 小时 48 分钟前

26

@wangchengwu 为什么要这样阴阳怪气呢？

5

sentinelK

2 小时 44 分钟前

deepseek 之前出圈，主要还是因为走的是最优性价比路线。和其他模型厂商的差异化足够明显。
而且发布的时机选择，无论是技术角度上，还是宣发角度上都堪称完美。

新模型要想达到之前 V3 的宣传高度不容易。
最起码裸模型得有 claude sonnet 同时期的统计学能力，然后成本还比 sonnet 低很多才有可能。

还有一个思路，就是目前国产 LLM 的工程化实现，或者说产品化还没有特别出圈的。如果有一个足够惊艳的产品化实现，尤其是在 cc 已经泄露的前提下，有可能是下一个爆点。

6

fuhanfeng

2 小时 44 分钟前

感觉今天晚上就要发了

7

mingtdlb

2 小时 43 分钟前

4

当他适配华为芯，在短期来看或者说放在全球来看，就不会崛起

8

Vaspike

2 小时 41 分钟前

依旧 deepdelay

9

catazshadow

2 小时 41 分钟前 via Android

1

捂嘴自己干掉训练语料，不可能的

10

kiracyan

2 小时 36 分钟前

下周回国

11

systemGuest

2 小时 33 分钟前

@mingtdlb deepseek 是政治任务，和鸿蒙系统一样，好不好用不重要，重要的是面子，全球崛不崛起不知道，但是国内一定会崛起。

12

junwind

2 小时 33 分钟前

@mingtdlb 哥们儿，这是 zz 任务，中国芯片如果大家都不用，那就只能看漂亮国的脸色。就像电车，这是国策，跟别的都没关系。

13

andlp

2 小时 30 分钟前

deepseek 主要还是适配国产芯片吧是一个标杆

14

andlp

2 小时 29 分钟前

2

@wangchengwu 阴阳怪气什么呢?难道美国能给你分钱?美国佬以前对印第安人是 50 刀买他们一张头皮,对你也只会用 50 刀买一张你的头皮

15

skuuhui

2 小时 22 分钟前

2

deepseek 目前有在商业落地并成功的案例吗？有啥 ai 应用的是 deepseek 。纯搞笑的项目不算

16

gaooo

2 小时 21 分钟前

@andlp 幻想太严重了，建议重新训练

17

wat4me

2 小时 20 分钟前

1

@wangchengwu DeepSeek 的 API 价格算低的了，这么喜欢用贵的大模型？还是贵的大模型给你发钱了

18

gaooo

2 小时 20 分钟前

2

@junwind ds 都成国家 zz 任务了？太能幻想了，了解下其他的国产模型行不，哪个不甩 ds 几条街

19

nicoSword

2 小时 16 分钟前

21

为什么感觉大伙儿对 DeepSeek 有什么仇恨，深度求索这公司本身一不搞炒作二不发广告，只搞技术，网页和 app 都是清清爽爽的，api 价格也便宜，虽然 v3.2 模型能力放现在不算突出，但它有什么值得恨的地方吗？

20

heftyMan

2 小时 14 分钟前

deepseek 感觉有点落后了

21

yangyaofei

2 小时 10 分钟前

1

这周各种传言太多了...多的都有点假了...

貌似现在的说法已经从周一左右的多模态变成纯文本模型了, 现在就希望他们到时候价格和 TPS 都好一点

22

yangyaofei

2 小时 10 分钟前

@nicoSword #19 因为那些人是 "凡是 XX 的我就要 XX" , 不会就事论事的讨论

23

junwind

2 小时 8 分钟前

@gaooo 其他家的哪个会去主动用国产卡的。

24

bannetlee

2 小时 7 分钟前

2

deepseek 已经不是一个技术产物了，现在是一个政治筹码

25

gaooo

2 小时 6 分钟前

@junwind deepseek 用国产卡了？信我是秦始皇还是自媒体？

26

Miaosful

2 小时 2 分钟前

差不多这两天了吧

27

CarryOnHxy

1 小时 59 分钟前

@mingtdlb 如果就像老黄说的，不用 CUDA ，中国模型跑中国芯，确实对英伟达冲击挺大的

28

Danswerme

1 小时 55 分钟前

Deepseek 到底有什么黑料？我看 X 和本站很多人都在嘲讽，这公司干什么坏事情了吗？

29

Yukiteru

1 小时 55 分钟前

deepseek 拿来做翻译还是不错的，性价比很高(如果有别的性价比更高的模型也欢迎推荐)
至于崛起不崛起的还是算了吧，我一点都不在乎谁崛起

30

zzh1224

1 小时 39 分钟前

9

用跟大国泥腿子+爱国绑定的 deepseek 岂不是玷污自己，当然得踩一脚才能显出自己中产小资特有的高人一等

31

tomcrowley

1 小时 33 分钟前

出不出的有啥影响
不会真有人用吧

32

dingawm

1 小时 29 分钟前

@Danswerme #26 X 上我倒很少看到有人嘲讽 DeepSeek ，不少外国人都挺期待的，但是不少人也预期这次可能没有那么大的提升。也有可能是因为我刷到的基本都是英文推

33

kulove

1 小时 29 分钟前 via Android

希望把价格打下来

34

tunggt

1 小时 28 分钟前

@Danswerme 和华为一样，崛起戳了非基本盘们的肺管子。
当然你也可以说它们无耻，用 openai 蒸馏，却自称完全自主研发。不过知识产权这东西，在国内从不是问题。华为不一样自主研发了安卓，不一样是民族骄傲。

35

encro

1 小时 27 分钟前

1

@sentinelK

1 ，推理流程可视化: 引起行业内行业外震惊，带动了推理和模型的发展，相当于苹果系统之与手机；

2 ，MoE （混合专家模型）:一个问题只激活“部分专家网络”，而不是整个模型，类似“分科医生看病”，不是所有医生一起上；

3 ，极致成本控制: 让中国厂商不被卡脖子，缩短差距。

4 ，国产芯片适配: 在原来芯片生态杀出血路，实现中国芯片弯道超车梦想。

以上，无论哪一样都是举足轻重，为中国大模型和芯片发展的贡献都无法被忽略。

所以，并不是宣传做得好，也不是时间卡得好，是实实在在的恰到好处贡献。

36

KiriGiri

1 小时 25 分钟前

deepseek 的竞争力就是 3 块钱 1M token ，如果出来新模型价格不变，或者象征性加一点价格，那就直接用爆。

37

sxw11

1 小时 24 分钟前

浙文互联已经涨停了我们的消息速度还是太慢了难受

38

ybybwdwd

1 小时 23 分钟前

@skuuhui 最近特斯拉不是接入 ds+豆包吗，当然效果咋样我就不知道了

39

MoonShot

1 小时 22 分钟前

ds 刚出来那会让纳指权重股跌了太多了，这实实在在伤了非基辈们的利益了吧🐶
后来居上的 kimi,qwen,minimax,glm 都没这么恨的

40

yanqiyu

1 小时 21 分钟前

只要不彻底拉了，价格不要 x10 ，那 deepseek 新模型就是日常任务的神

41

unclejoker

1 小时 18 分钟前

@nicoSword 因为他是国产，这就是最大的原罪

42

Nzelites

1 小时 18 分钟前

v4 就算出了肯定也不算最好不过尽力适配国产芯片也算是打破垄断的一点努力吧至于这么恨吗？

43

encro

1 小时 18 分钟前

我对 ds 的期望：

1 ，有差不多 gpt 5.4 的能力，暂时没有也没有关系，慢慢有就行了；
2 ，保持现在的价格不升；
3 ，带动国产芯片实现中国产业链，不再需要翻墙去用 gpt 和 claude ；

44

june4

1 小时 17 分钟前

期待再次雄起
哪怕水平和别的国产一致，只要容量和价格有优势也是大杀器，不知道适配国产卡对达成这个有没有加成

45

c0nstantien

1 小时 16 分钟前

@zx9481 因为它是非基辈

46

tobepro

1 小时 16 分钟前

@tunggt 蒸馏这事也不好说无耻把，哪家没蒸馏过？天下乌鸦都是一般黑

47

c0nstantien

1 小时 16 分钟前

@wangchengwu 转人工

48

JoeDH

1 小时 14 分钟前

去年一开始就该融资了，让核心成员看不到希望被人挖跑了。
感觉梁有点太理想主义或者说自我，不融资进来给员工加钱不加大力度买算力，怎么出成果

49

gaooo

1 小时 13 分钟前

@nicoSword deepseek 绝对是一家纯粹的技术公司，大伙并不是对 deepseek 仇恨，主要是假消息太让人讨厌了，满怀期待结果一次次落空

50

jackyli1

1 小时 11 分钟前

又要赢麻了

51

kpprotector

1 小时 9 分钟前

@tunggt 蒸馏是啥都不知道，一天到晚在那“蒸馏”。
蒸馏直接输出的是数据，模型架构蒸馏不出来的。
deepseek R1 出来之前 O1 输出的思维链都是假的，蒸馏啥呢……

52

woctordho

1 小时 2 分钟前 via Android

@mingtdlb 你说的“全球”大概是北美加欧洲吧，然而中国的人口比北美加欧洲还多

53

germain

1 小时 2 分钟前

刚离职的公司有几个业务背后都是 DeepSeek （ Azure AI Foundry ），跑了一年了，一直挺好。

DeepSeek 是我用过最省心的 AI 提供商，没有之一，知道它的能力边界，适配合适的任务和应用，从来没失望过。

54

mightybruce

1 小时 2 分钟前

deepseek 现在就是带着政治任务，况且还能吸引一堆小粉红和无脑粉，反感 deepseek 的无脑粉丝，其本身的确有特色。

deepseek 很多技术人才早就去了小米，字节跳动等公司。

现在 deepseek 除了能贡献学术论文以外，不上市直到现在才融资就不要报什么希望吧，多模态大模型早就难产了。

55

sharpy

1 小时 1 分钟前

deepseek 太研究型了，现在 kimi glm 的模型架构都是基于 ds ，比 ds 的 v3 搞得更大，更 scale ，后训练更猛，都搞出了这么多成绩，如果 ds 在去年爆火的时候直接融资，然后一路狂飙，现在不可想象。

但现在也不算迟，他们只要真能走通他们发表的论文里的那些方案，也不算迟。

56

yuyisuo

59 分钟前

1 楼看来是拿到 Anthropic 的一亿了，还他妈是美刀，羡慕

57

mightybruce

55 分钟前

国内无脑粉和傻叉自媒体天天吹 deepseek, 结果没出，打了他们脸面
别在说什么国内大模型都是学 deepseek 的，MOE 根本提出的不是 deepseek, 最早提出的法国的 AI 公司 mistral ai

国内 kimi 不是 MOE 好吧，是线性注意力，我天天看着这些 deepseek 粉丝真是闲得蛋疼，每天都是 deepseek 第一，打破了 XXX, 我都怀疑是不是中宣部派来的。

58

TonyMontana

53 分钟前

下楼做”核算“了

59

kpprotector

51 分钟前

deepseek 走的是性价比路线，即便现在模型能力都难达到二流水准，但这个月 Openrouter 的用量还是稳居前三。
而且 deepseek 在 Role Play 这个类别里常年保持第一，我有时候都怀疑这属于 deepseek“幻想”严重的某种优势了。

不过现在 deepseek 的新闻真的懒得看了（即便现在 v4 似乎真的要出了），从去年 12 月开始营销号就反复刷 v4 的新闻，看的都让人想吐了。