V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  coefu  ›  全部回复第 43 页 / 共 58 页
回复总数  1154
1 ... 39  40  41  42  43  44  45  46  47  48 ... 58  
@trungdieu031 刚才关于知识树的比喻,我好像错了,就这样了吧,后续再去学习。这个话题,我不打算继续讨论了,不必再艾特我。
@coefuqin 英文世界有人把 LLM 叫做 stochastic parrot ,很贴切了。上面那人就是因为我把这个说法搬过来叫做概率鹦鹉跑来追着我咬的

属实难绷。这个话题,我打算打住了,其实上次我看到这个报道的时候,我也是生出了和你一样的想法,没想到还会有人能拿出来讨论,我觉得英雄所见略同,甚是欣慰,我道不孤也,老铁,后会有期。
@trungdieu031 在 COT 这个问题上,你和我不在一个频道,你理解的能力和我理解的能力不是一个概念,可以就此打住。至于我是不是听风就是雨,我比你更清楚。我能对你回复,已经算是出于好意了。不必再艾特我了。
@trungdieu031 COT 只是让一个小学生对他思考模式更缜密,再怎么强化思考过程,也独立思考不出来微积分。并没有提升模型的能力。就像知识树,只是在现有的树里攘括更多的分支和节点而已,树本身没有拓展。那提升了什么能力呢?那些知识或许本身就有,但只是没想到而已。
2025 年 5 月 15 日
回复了 LunarSurfCorp 创建的主题 职场话题 转行做网安,找不到工作,家里变故,身心俱疲
@catazshadow llm 的本质就是下一个字的概率预测,自己多看点入门的书就知道了,比如从零开始训练一个大模型。
@icyalala 你对智能的理解量,决定了是不是不如老鼠咯,你和我都不在一个频道上,有什么可讲的,不要艾特我了。
@trungdieu031 我过过脑子,当前 LLM reason 的能力怎么来的?不是 RL 后训练得到的? COT 真要有提升的话,还关参数量什么事情? 9B 的 LLM 带上 COT 能和 671B 的不带 reason 的比?
@trungdieu031 不是 GPU 的摩尔定律没到头,是他把芯片越做越大来提升的性能。因为 GPU 的独立性,他把现在电路板都做成芯片也行。
@icyalala 老鼠能感知危险,LLM 能吗?你对于智能的理解很片面。
@trungdieu031 别闹,但凡单卡能无敌上限,他会卖一体机?还搞光交换机拓展机柜?
@NoOneNoBody 乐观估计几十年。
@catazshadow yep ,摩尔定律到头了,无法切割原子。另外纵向立体堆叠也要考虑热量的问题。
@cmdOptionKana 人脑内部演算,就是杨立坤现在搞的世界模型这条路。
@cmdOptionKana 不能,见我上述,语言只是智能的一个子集。
为了对股东有个交代,但凡有一种新的“大脑”模型,能对于陌生环境的问题,通过极少的训练(后者 0 训练,直接在动手的过程中学习)就能解决,谁用强化学习(针对特定场景试错巨量次来取得成功的经验)这种笨办法啊?
我纠正#64 的回答。

1 是 RL 的路线,2 是世界模型的路线。是因为本身缺少一个从根本上就无法高效泛化的“大脑”才走上面 2 个路线。

我纠正一下我的这个回答,因为 2 我回答错了,

这两种方法都是 RL 强化学习的方法,1 是在线强化学习,2 是有模型强化学习。
对于当前那些具身双足机器人学习家政或者别的人类技能的时候,用强化学习来做,那是没办法的办法,并不是这个办法是最优解。强化学习策略的泛化能力,在环境有根本性变化之后,就很低了。但是世界环境的特征是无穷的啊,怎么可能靠枚举来解决。或许在家政这个具体的领域,环境是可以收敛的,但是这个环境系数依然是庞大的。
@cmdOptionKana 你误解了我的观点,我的观点是对于技能泛化的能力。狼孩回归社会之后,擦桌子拖地不需要训练几千次才掌握,这就是我的观点。
@windghoul 栓 Q 。
1 ... 39  40  41  42  43  44  45  46  47  48 ... 58  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   956 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 19:38 · PVG 03:38 · LAX 12:38 · JFK 15:38
♥ Do have faith in what you're doing.