1
Suger828 23 小时 0 分钟前
没有开源源代码 ,只有论文,你去复现吧
|
2
dajj 14 小时 26 分钟前
好像是模型免费下载, 国产就是善于创造概念,这么算 gimmy 也是开源的
|
3
zenghx 14 小时 20 分钟前 via iPhone
|
4
zlowly 14 小时 0 分钟前
|
6
Felixchen1062 13 小时 22 分钟前
感觉 LLM 模型之类的开源,不等同于工程项目的开源
好比我写了一篇文章,允许随意使用,但我也不需要提供字/词典吧,LLM/CV 模型训练更像是一个 cooking 的过程,食谱,食材都端上来了,毕竟它不像是一个工程项目。 至于楼上那位国产创造概念的观点,我不太清楚 llama 开源是不是也是这种形式,可以考证一下 |
7
CynicalRose 12 小时 59 分钟前
llama3 的代码仓库: https://github.com/meta-llama/llama3 ,虽然我到现在都没跑起来
deepseek 的仓库没有代码的: https://github.com/deepseek-ai/DeepSeek-R1 ,v3 还没试: https://github.com/deepseek-ai/DeepSeek-V3 |
8
iorilu 12 小时 58 分钟前
大部分模型所谓开源就是指训练好的模型权重开源, 反正你直接可以用
但不会告诉你怎么训练出来的, 更不会给你训练材料 |
9
CynicalRose 12 小时 57 分钟前
@CynicalRose LLM 的开源多数只提供 inference 的代码,想训练只能自己尝试复现了。
|
11
yanggb 12 小时 2 分钟前
@dajj LLM 领域目前是这样的,DeepSeek 以 MIT 协议开源了模型权重,附赠实现论文,已经让 AI 研究者激动,甚至有人已经复现了: https://github.com/hkust-nlp/simpleRL-reason/tree/main
|
12
c0nstantien 11 小时 58 分钟前
@dajj 赢!
|
13
nickchenyx 11 小时 54 分钟前 4
@dajj 我也是第一次听说 OpenAI 原来是 Close 的
|
14
visitantzj 10 小时 7 分钟前
汗……还要人家把业务数据、代码都给你才行?要不要再免费搭上能跑得动的 vps
|
15
crackidz 7 小时 43 分钟前
DeepSeek 是训练过程全写到论文里了,你可以根据论文直接复现。https://github.com/huggingface/open-r1
|
16
crackidz 7 小时 42 分钟前
要不怎么说 DeepSeek 是大善人呢
|
17
crackidz 6 小时 58 分钟前
@CynicalRose deepseek r1 的代码就是 v3 的仓库,是同一套代码只是权重不一样。这个 README 里有啊
|
18
csys 6 小时 33 分钟前 via Android
上次 deepseek v3 出来的时候站里就已经闹过不少笑话了
现在怎么还这样啥都不懂就信口开河,不长记性吗😅 动动手问问 llm 也行啊 |
19
AlohaV2 3 小时 5 分钟前
|
20
SGL 30 分钟前
这就说明搞算法的和搞开发的”隔行如隔山“了 。
|