

1
JoeJoeJoe PRO 感谢分享干货!
我突然发现一个很严重的问题, 因为用 AI 分析成为习惯了, 现在看到这些复杂数据对比或者文字密集的时候, 我会下意识的规避或者逃避, 想让 AI 来帮我总结一下. 幸亏看 op 这个帖子突然醒悟, 再次感谢 op! |
2
sillydaddy OP @JoeJoeJoe 搜集资料时,我也问了 AI ,😂
|
3
thinszx 1 天前
看这张图,25 年模型侧真的发生太多事了
|
4
iloveoovx 23 小时 57 分钟前
宏观来看一定会找到新方法,本来这么高的投入,对于木桶短板会更敏感;就像为啥上来猛搞数据因为那时数据肯定更容易搞,数据提量提质效果收益明显;数据搞差不多了就只好在没那么直接的训练上想办法。之后到一定程度了又会回数据的,就像练武的会去找葵花宝典。当然训练的花活还有很多空间,没必要盯死觉得 rl 决定一切
|
5
sillydaddy OP @iloveoovx 一旦 RL 缩放放缓,虽然还有其他优化空间,但是会直接影响 scaling 的速度。
另外,我发这个,也是说明我对这些 AI 公司很不信任:连这些基本的信息,他们都不会放出来,比如我们的 RL 缩放还能支持多长时间之类的话。从我发的主题里面的评论可以知道,大家基本都靠猜。 如果这么基本的无害的信息,他们都要闭嘴不提,我根本不能相信这些 AI 公司能有什么透明度和操守。话倒是都说得很漂亮。 |
6
iloveoovx 23 小时 31 分钟前
你这话说得,entitlement 大了点吧。什么叫无害?因为很多人误会然后大嚷大叫说 AI 进步到头了损伤股价叫不叫无害?何况是这种置信度很低的单维度指标 - 他们最多根据现在的情况估计下 rl 能带来多久值当的 loss 下降收益,但和最终用户的满意程度之间的关系,随着各种策略切入只会越来越低,在学术界层出不穷的思路优化中,他们自己也不可能知道是否会有调整以及如何调整,怎么给你一个让你满意的答案呢?这可是在造上帝;你把这单一维度看得比天高,并认为那些 AI 公司已经知道一切,说明你把概念抓得太紧,被逻辑理性概念洗脑有点深,不开玩笑建议去学点灵性神学对冲下
|
7
sillydaddy OP @iloveoovx
你这逻辑跳跃的,确实该补点逻辑,而不是脑补什么「一听到 RL 缩放还能持续 1 年,就发生误会,损伤了股价」,你后面不也说了学术界有层出不穷的优化思路吗? 另外,现实不就是 RL 缩放主导了缩放定律吗,主题里也提到了,缩放的方式改变了。怎么在你这里就成了置信度很低的单维度指标。 关于 AI 公司的责任,考虑到我没有给你足够的上下文,我来补充一下,以免你产生幻觉。 首先这个责任这不是我强加给它们的,所有 AI 公司都在说公共责任,特别是 Anthropic 。你可以看看他们出席多少公共论坛、接受多少公共采访,畅谈他们对 AI 的发展判断,去看看阿莫代伊的博客,里面「仁慈的机器」都出来了。 然后你知道什么是 AI 发展中最重要的吗,不是别的,恰恰是 Scaling Law ,没有之一。谈 AI 发展的前提,就是谈缩放定律,而我说的 RL 缩放的时效,恰恰包含在里面,它还是一个核心。 考虑到上面的 2 点上下文,你再去分析一下他们公开的发言,通篇都是多少年实现 AGI ,对未来的影响,但这些务实的缩放定律时效,他们丝毫不涉及!这个时效,是一个客观的东西,不是你说的用户满意度,它受限于客观的算力。你觉得,他们在面对投资人的时候,也会像面向公众的时候,大谈 AGI 大谈它们的进步,却对这些时效问题闭口不谈吗?这种态度的区别,说明了什么呢?你的道德标准可能比较低,认为这没有什么问题。我的标准跟你不一样。 另外我上面的回复也没有针对你啊,你这刻薄的毛病从哪儿来的。 |