提示词为:
你能不借助工具,心算一道乘法题吗?为保证准确性,你必须要一步一步计算。
836478824 * 78352
测试结果:
✅:ChatGPT 网页版,Gemini 3.0 网页版思考模式,Cursor 中的 Opus4.5 。
❌:Sonnet4.5 网页版。
更大的测试数据,可能会导致思考过程超出上下文,尤其是 opus4.5 。
是否说明现在的 AI 思考模式的效率还不太行?如果是人的话,使用相同的 thinking 模式,所需的上下文(如纸笔)会很少。不过至少比以前完全不能计算要强多了。
1
zisen 1 天前
我的 Gemini3pro 算错了,人类使用纸笔也算使用工具,让我自己心算我也记不住全部数字,或者要算很久,而且最终还不能通过心算测试自己算的对不对
不过有一些心算诀窍可以简化,可以试试把一些诀窍告诉 ai 让它再去算 |
2
sillydaddy OP @zisen chatgpt 和 gemini 分解的都不彻底,它们只分解了乘数,没有分解被乘数,即使再次提醒也做不到完全分解。而 opus 分解得很彻底,每一步都很详细,不过位数过长会被服务器中断响应。
AI 的思考模式,其实相当于人类的纸笔,因为人心算时的工作记忆容量比较小,脑袋里面记不住那么多中间结果,但 AI 可以通过中间思考产生的 token 缓存它们,相当于人类的纸笔了。 |
3
zisen 1 天前
@sillydaddy 确实,如果算一笔记一笔的话,会比全部位数算好最后想加要来的更加稳妥,因为最后一步将所有位数的结果相加的时候,注意力无法兼顾前面每次的计算结果,导致最终算错
|
4
dimlau 1 天前
|
5
sillydaddy OP @dimlau 你的 gemini 怎么这么厉害?
|