1
wangchengwu 2 小时 57 分钟前 是要崛起了,宇宙第一,然后分你一个亿
|
2
Sundayz 2 小时 51 分钟前
以现在 deepseek 的研发投入和状态,不要对新模型抱有太大期望。
|
3
cairnechen 2 小时 48 分钟前
...就算不懂技术也要懂政治啊,DeepSeek V4 做不到 SOTA 是不会发布的,这都想不明白吗?
|
4
zx9481 2 小时 48 分钟前 @wangchengwu 为什么要这样阴阳怪气呢?
|
5
sentinelK 2 小时 44 分钟前
deepseek 之前出圈,主要还是因为走的是最优性价比路线。和其他模型厂商的差异化足够明显。
而且发布的时机选择,无论是技术角度上,还是宣发角度上都堪称完美。 新模型要想达到之前 V3 的宣传高度不容易。 最起码裸模型得有 claude sonnet 同时期的统计学能力,然后成本还比 sonnet 低很多才有可能。 还有一个思路,就是目前国产 LLM 的工程化实现,或者说产品化还没有特别出圈的。如果有一个足够惊艳的产品化实现,尤其是在 cc 已经泄露的前提下,有可能是下一个爆点。 |
6
fuhanfeng 2 小时 44 分钟前
|
7
mingtdlb 2 小时 43 分钟前 当他适配华为芯,在短期来看或者说放在全球来看,就不会崛起
|
8
Vaspike 2 小时 41 分钟前
依旧 deepdelay
|
9
catazshadow 2 小时 41 分钟前 via Android 捂嘴自己干掉训练语料,不可能的
|
10
kiracyan 2 小时 36 分钟前
下周回国
|
11
systemGuest 2 小时 33 分钟前
@mingtdlb deepseek 是政治任务,和鸿蒙系统一样,好不好用不重要,重要的是面子,全球崛不崛起不知道,但是国内一定会崛起。
|
13
andlp 2 小时 30 分钟前
deepseek 主要还是适配国产芯片吧 是一个标杆
|
14
andlp 2 小时 29 分钟前 @wangchengwu 阴阳怪气什么呢?难道美国能给你分钱?美国佬以前对印第安人是 50 刀买他们一张头皮,对你也只会用 50 刀买一张你的头皮
|
15
skuuhui 2 小时 22 分钟前 deepseek 目前有在商业落地并成功的案例吗? 有啥 ai 应用的是 deepseek 。纯搞笑的项目不算
|
17
wat4me 2 小时 20 分钟前 @wangchengwu DeepSeek 的 API 价格算低的了,这么喜欢用贵的大模型?还是贵的大模型给你发钱了
|
19
nicoSword 2 小时 16 分钟前 为什么感觉大伙儿对 DeepSeek 有什么仇恨,深度求索这公司本身一不搞炒作二不发广告,只搞技术,网页和 app 都是清清爽爽的,api 价格也便宜,虽然 v3.2 模型能力放现在不算突出,但它有什么值得恨的地方吗?
|
20
heftyMan 2 小时 14 分钟前
deepseek 感觉有点落后了
|
21
yangyaofei 2 小时 10 分钟前 这周各种传言太多了...多的都有点假了...
貌似现在的说法已经从周一左右的多模态变成纯文本模型了, 现在就希望他们到时候价格和 TPS 都好一点 |
22
yangyaofei 2 小时 10 分钟前
@nicoSword #19 因为那些人是 "凡是 XX 的我就要 XX" , 不会就事论事的讨论
|
24
bannetlee 2 小时 7 分钟前 deepseek 已经不是一个技术产物了,现在是一个政治筹码
|
26
Miaosful 2 小时 2 分钟前
差不多这两天了吧
|
27
CarryOnHxy 1 小时 59 分钟前
@mingtdlb 如果就像老黄说的,不用 CUDA ,中国模型跑中国芯,确实对英伟达冲击挺大的
|
28
Danswerme 1 小时 55 分钟前
Deepseek 到底有什么黑料? 我看 X 和本站很多人都在嘲讽,这公司干什么坏事情了吗?
|
29
Yukiteru 1 小时 55 分钟前
deepseek 拿来做翻译还是不错的,性价比很高(如果有别的性价比更高的模型也欢迎推荐)
至于崛起不崛起的还是算了吧,我一点都不在乎谁崛起 |
30
zzh1224 1 小时 39 分钟前 用跟大国泥腿子+爱国绑定的 deepseek 岂不是玷污自己,当然得踩一脚才能显出自己中产小资特有的高人一等
|
31
tomcrowley 1 小时 33 分钟前
出不出的有啥影响
不会真有人用吧 |
32
dingawm 1 小时 29 分钟前
@Danswerme #26 X 上我倒很少看到有人嘲讽 DeepSeek ,不少外国人都挺期待的,但是不少人也预期这次可能没有那么大的提升。也有可能是因为我刷到的基本都是英文推
|
33
kulove 1 小时 29 分钟前 via Android
希望把价格打下来
|
34
tunggt 1 小时 28 分钟前
@Danswerme 和华为一样,崛起戳了非基本盘们的肺管子。
当然你也可以说它们无耻,用 openai 蒸馏,却自称完全自主研发。不过知识产权这东西,在国内从不是问题。华为不一样自主研发了安卓,不一样是民族骄傲。 |
35
encro 1 小时 27 分钟前 @sentinelK
1 ,推理流程可视化: 引起行业内行业外震惊,带动了推理和模型的发展,相当于苹果系统之与手机; 2 ,MoE (混合专家模型):一个问题只激活“部分专家网络”,而不是整个模型,类似“分科医生看病”,不是所有医生一起上; 3 ,极致成本控制: 让中国厂商不被卡脖子,缩短差距。 4 ,国产芯片适配: 在原来芯片生态杀出血路,实现中国芯片弯道超车梦想。 以上,无论哪一样都是举足轻重,为中国大模型和芯片发展的贡献都无法被忽略。 所以,并不是宣传做得好,也不是时间卡得好,是实实在在的恰到好处贡献。 |
36
KiriGiri 1 小时 25 分钟前
deepseek 的竞争力就是 3 块钱 1M token ,如果出来新模型价格不变,或者象征性加一点价格,那就直接用爆。
|
37
sxw11 1 小时 24 分钟前
浙文互联已经涨停了 我们的消息速度还是太慢了 难受
|
39
MoonShot 1 小时 22 分钟前
ds 刚出来那会让纳指权重股跌了太多了,这实实在在伤了非基辈们的利益了吧🐶
后来居上的 kimi,qwen,minimax,glm 都没这么恨的 |
40
yanqiyu 1 小时 21 分钟前
只要不彻底拉了,价格不要 x10 ,那 deepseek 新模型就是日常任务的神
|
41
unclejoker 1 小时 18 分钟前
@nicoSword 因为他是国产,这就是最大的原罪
|
42
Nzelites 1 小时 18 分钟前
v4 就算出了肯定也不算最好 不过尽力适配国产芯片也算是打破垄断的一点努力吧 至于这么恨吗?
|
43
encro 1 小时 18 分钟前
我对 ds 的期望:
1 ,有差不多 gpt 5.4 的能力,暂时没有也没有关系,慢慢有就行了; 2 ,保持现在的价格不升; 3 ,带动国产芯片实现中国产业链,不再需要翻墙去用 gpt 和 claude ; |
44
june4 1 小时 17 分钟前
期待再次雄起
哪怕水平和别的国产一致,只要容量和价格有优势也是大杀器,不知道适配国产卡对达成这个有没有加成 |
45
c0nstantien 1 小时 16 分钟前
@zx9481 因为它是非基辈
|
47
c0nstantien 1 小时 16 分钟前
@wangchengwu 转人工
|
48
JoeDH 1 小时 14 分钟前
去年一开始就该融资了,让核心成员看不到希望被人挖跑了。
感觉梁有点太理想主义 或者说自我,不融资进来给员工加钱 不加大力度买算力,怎么出成果 |
50
jackyli1 1 小时 11 分钟前
又要赢麻了
|
51
kpprotector 1 小时 9 分钟前
|
53
germain 1 小时 2 分钟前
刚离职的公司有几个业务背后都是 DeepSeek ( Azure AI Foundry ),跑了一年了,一直挺好。
DeepSeek 是我用过最省心的 AI 提供商,没有之一,知道它的能力边界,适配合适的任务和应用,从来没失望过。 |
54
mightybruce 1 小时 2 分钟前
deepseek 现在就是带着政治任务, 况且还能吸引一堆小粉红和无脑粉,反感 deepseek 的无脑粉丝,其本身的确有特色。
deepseek 很多技术人才早就去了小米,字节跳动等公司。 现在 deepseek 除了能贡献学术论文以外, 不上市直到现在才融资就不要报什么希望吧, 多模态大模型早就难产了。 |
55
sharpy 1 小时 1 分钟前
deepseek 太研究型了,现在 kimi glm 的模型架构都是基于 ds ,比 ds 的 v3 搞得更大,更 scale ,后训练更猛,都搞出了这么多成绩,如果 ds 在去年爆火的时候直接融资,然后一路狂飙,现在不可想象。
但现在也不算迟,他们只要真能走通他们发表的论文里的那些方案,也不算迟。 |
56
yuyisuo 59 分钟前
1 楼看来是拿到 Anthropic 的一亿了,还他妈是美刀,羡慕
|
57
mightybruce 55 分钟前
国内无脑粉和傻叉自媒体天天吹 deepseek, 结果没出,打了他们脸面
别在说什么国内大模型都是学 deepseek 的,MOE 根本提出的不是 deepseek, 最早提出的法国的 AI 公司 mistral ai 国内 kimi 不是 MOE 好吧,是线性注意力,我天天看着这些 deepseek 粉丝真是闲得蛋疼,每天都是 deepseek 第一,打破了 XXX, 我都怀疑是不是中宣部派来的。 |
58
TonyMontana 53 分钟前
下楼做”核算“了
|
59
kpprotector 51 分钟前
deepseek 走的是性价比路线,即便现在模型能力都难达到二流水准,但这个月 Openrouter 的用量还是稳居前三。
而且 deepseek 在 Role Play 这个类别里常年保持第一,我有时候都怀疑这属于 deepseek“幻想”严重的某种优势了。 不过现在 deepseek 的新闻真的懒得看了(即便现在 v4 似乎真的要出了),从去年 12 月开始营销号就反复刷 v4 的新闻,看的都让人想吐了。 |
60
bc1 46 分钟前
deepseek 企业端调用的很多呀,为啥会觉得没人用呢,不会是觉得只有敲代码和养龙虾才用 AI 吧。。。。
|
61
foolherb 45 分钟前
昇腾+v4 ;难度是比较高
|
62
wxm 44 分钟前
trae 配置 deepseek-reasoner 生成的代码很难评
|
63
kpprotector 40 分钟前
@nicoSword 到目前为止 deepseek 本身倒是没啥问题,模型也是该用就用,但是营销号整天“赢赢赢”太烦了。
|
64
K0ma 38 分钟前
层主搞个水文博得了流量,只剩下评论区网友们吵得不可开交。
|
65
justfindu 38 分钟前
deepseek 本身没啥问题, 理论和实现都得到了认可. 但是现在又要搞完全适配昇腾. 感觉很难啊.
|
66
br9852000 37 分钟前 看这评论意思是要直接投降?你投降,人家也不让你用 gtp 、Claude 、gemini 。有点骨气吧,一天到晚殖里殖气。好像自己站在对的一面。人家理你吗?做狗人都收你。贱不贱
|
68
svtter 34 分钟前
deepseek 没发,k2.6 和 mino-v2.5-pro 发了。还有 qwen3.6 27B ,太猛了。
|
69
irvinghua 33 分钟前
程序员的现状不就是全体戴上面具,跪在地上,双手捧着钱递给 A 厂,A 厂还要时不时抽查面具戴没戴好,没戴好就反手拿起钱抽程序员们一个大嘴巴子。被抽了一声都不敢吭,还得忍。就这样状态了,有解放者的希望来了,居然还有人喝倒彩。
|
73
stormsuncc 22 分钟前
成天幻想 zz 任务呢
|
74
gibber 22 分钟前
对于有些人来讲,国产就是原罪。
|
78
cfancc 13 分钟前
不出所料看到一群汪汪队,欧美人喂的狗粮还真是好。伊朗的网络设备刚被留的硬件后门废掉了,Deepseek 的意义就在于不用面对这种情况
|
79
ccpp132 9 分钟前
没那么多鸟事,现在卡芯片进口,国内算力普遍不足,基本上家家都在国内外芯片混用
|