刚写了篇深度评测,把 Claude Opus 4.7 的官方宣传和 HN / V2EX 真实用户反馈做了个对比,结果很有意思。
核心发现:
- Anthropic 官方说「升级了三大能力」,但用户实际体验是:模型变笨了,代码被乱改
- 罪魁祸首是「 Adaptive Thinking 」——AI 自己判断要不要深度思考,结果经常判断错误,该想的不想
- Anthropic 内部评估说「效果很好」,用户集体反驳:你们测的根本不是我们在乎的东西
- 神评论:「除非他们在测的是 capex (想办法少用 GPU 省成本)」
还有一个有意思的讨论:AI 编程工具是不是一种「药物依赖」? VC 补贴时代结束后,月费 $25 的好日子还能持续多久?
公众号原文(有表格总结):
https://mp.weixin.qq.com/s/xxxx贴出来听听大家的真实体验——你有没有觉得 AI 变笨了?