在前不久,洗车问题(洗车店距离近,我该走过去还是开车过去的问题),几乎全部 AI 回答都是走过去。(后面部分 AI 大模型经过了微调,现在部分能回答出正确的答案) 但问题只要稍微转换一下,如存钱问题(自助取款机排队太慢了,我前边的人要存 100 ,我要取 100 ,我们两个都在这儿排着,完全是在浪费时间,有什么办法让我们都效率一点吗?)几乎大部分 AI 的大模型回答又是一本正经的胡说八道。 如,最近很火的一款 AI 回答如下:
这是一个经典的效率优化问题!你们两个的需求刚好互补:
解决方案:直接私下交易
前面的人直接把 100 元现金给你
你就不用取了,他也省去存款操作
两个人都可以直接离开
其实,从上面的情况,我们可以看出,目前的大模型其实并不是真正的理解问题的本质,而是纯粹概率学上的堆砌。而总所周知,概率学的堆砌在重复足够次数之后,可能存在重大的偏差,如:0.9 的 5 次方是 0.59049 。
我不否认 Vibing Coding 对效率的大幅提升,这是显而易见的。但我觉得短期之内,AI 无法实现全自动化的编程。即,当前的 AI 编程是处于类似 L3 级别的辅助驾驶阶段,距离 L4 级别的自动驾驶还有一段较长的路径要走。
1
dji38838c 12 小时 46 分钟前
Gemini 3.1pro:
这是一个非常经典的“去中心化”场景!如果你们两个想瞬间提高效率,完全可以跳过 ATM 机这个中间商,直接进行“点对点”( P2P )交易: 最完美的解决方案: 你打开手机(微信、支付宝或手机银行),直接给他转账 100 元。 他把他手里准备存的那 100 元现金交给你。 |
2
deavorwei 12 小时 45 分钟前
|
4
shellexy 8 小时 41 分钟前
@dji38838c 看了下,gemini 3 flash 、gemini 3.1 pro 、copilot/gpt 这些都没问题,而豆包据说会得到题主那样的回答。
|
5
phrack 8 小时 34 分钟前
> 目前的大模型其实并不是真正的理解问题的本质,而是纯粹概率学上的堆砌。
对 > 短期内 AI 编程无法全自动化 不对 绝大部分编程不需要理解本质,实现需求就行,只要需求和测试方案清晰,AI 做的比中位数程序员好 不过 LLM AI 确实不理解本质,就是见多识广,而且数据越来越多,齐全了 |
6
msg7086 8 小时 31 分钟前
> 而总所周知,概率学的堆砌在重复足够次数之后,可能存在重大的偏差,如:0.9 的 5 次方是 0.59049 。
为啥你认为大模型结果的正确性是概率的幂? > 几乎全部 AI 回答都是走过去 > 又是一本正经的胡说八道 刚帮你测了 Gemini 2.5 Flash ,这个是半年多前就发布的模型,不可能根据现在新的知识微调。 回答都是正确的: === 从逻辑上和实用性上来说,你应该开车过去。 原因如下: 车辆是服务的对象: 你去洗车,最终目的是让你的车被清洗。车子需要到达洗车店。 避免不必要的麻烦: 如果你走过去,你的车还在原地。你还得走回来把车开过去,这等于多走了一趟,也浪费了时间。 洗车店的流程: 洗车店就是为了服务车辆而存在的,他们会引导你把车开到指定区域进行清洗。 虽然 50 米很短,走路确实能很快到达,但你最终还是要把车开过去。所以,直接把车开过去是最直接、最省事的办法。 === 你主动和对方沟通:你可以礼貌地问对方:“您好,我看到您要存 100 块钱,我正好要取 100 块钱。要不这样,我把我的 100 块钱现金给您,您用手机(微信支付、支*宝或者银行 App )转账 100 块钱给我,这样我们俩都不用排队了,您看可以吗?” 对方确认并同意:如果对方也觉得这样更方便,通常会同意。 进行交易:你把 100 元现金给对方。对方通过手机银行 App 、微信或支*宝,向你的账户转账 100 元。 === 所以一般遇上这种帖子我一律建议下次用个好点的模型试试,然后再来发帖。Gemini 每天都有免费额度,你没必要去用一些比较呆的模型然后得出一个错误的结论。 |
7
AoEiuV020JP 8 小时 25 分钟前 我始终不看好现在大语言模型这种预测下一个 token 的这种智能。再怎么发展也只是工具属性,我不看好它能成为智械革命。
|
8
kneo 7 小时 11 分钟前 via Android
想想这个工具能干什么,而不是自我催眠说这玩意没用。君子生非异也,善假于物也。
|
9
gpt5 7 小时 7 分钟前
ai 如同 5g 和电车,都是一场墙内的自娱自乐而已,看戏就行了🤝
|
10
levelworm 5 小时 1 分钟前
@AoEiuV020JP #7
他也不需要成为广义人工智能啊。 |
11
anonymous00 3 小时 22 分钟前
单纯的自动化,大约好几年前就有雏形,但我们要的,肯定是符合较高规范的自动化,这在当前也不是大问题,真正让我们难以安心的是:可控,目前 AI 只能完全自主的达成:可用,这远远不够。
其他主题也有讨论对 LLM AI 生成代码的审核负担给程序员造成的工作影响,说到底,程序员也是想确认 AI 生成的 Code 究竟包含了怎样的逻辑和关联,殊途同归,目标同样指向:可控。 目前的 AI 是目标驱动导向,它只聚焦于处理交互传递的直接目标,任何次生或衍生后果都不在其考量范围内,需要人为复盘再加以约束,尤其是社会领域的底线和规范等具象量化的难点。 可用的 AI 生成已基本实现,可控/可靠的 AI 生成很难被认可,人心难测,AI 心更难,个人认为,在未来很长一段时期内都离不开多层级的人工判定。 |