Claude vs Codex vs Gemini

搞些个人兴趣项目，三个 coding agent 都用了不少，我只是做简单的工具类小项目，就有很直观的体验。

Gemini 经常胡言乱语，改的一堆 bug ，反反复复跟他拉锯才能改对，心很累，挂上一些 harness 也不管用，感觉就跟弱智对话一样。虽然 token 量大管饱，但大项目真有人用这玩意吗

Codex 好很多，但是有时候也要反复几次才改对，前端经常出些小问题，但是提醒一下也能改对

三个里面最好用的还是 Claude ，虽然$20 的 plan 5h session 经常两三个大的改动就耗光了，但是出的成果质量高很多，不需要一个劲的 follow up ，经常能找到 Codex 找不到的 bug

现在我有 Claude 和 Codex $20 plan 。我拿 Claude 做大改动，code audit ，code review; Claude 额度用完了就用 Codex. Gemini 是 Google Drive 的 plan 送的，我只用它来做些确定性高的重复劳动

有没有人说说国产模型的使用体验？

Claude

Codex

Gemini

25 replies • 2026-06-27 23:48:19 +08:00

ebushicao

1 day ago

glm-5.2 搭配 zcode 算是国内能力最好的了，缺点是不支持多模态，而且官方 coding plan 抢不到，我是用的 opencode go 订阅。

kimi 的优势是支持多模态，前端页面写的还行，但能力还是差了点，kimi-2.7 有时候感觉比 kimi-2.6 还差一些。

deepseek 能力一般，但价格便宜并发还高，简单任务很适合。

qwen3.7-max ，拉完了，官方吹的太高，实际依托答辩，一些简单的 deepseek-v4-flash 都能做好的事居然也会出错。

mimo ，拉完了，首发我就买了，能力不如 deepseek ，唯一好点的就是非 pro 模型支持多模态，V 站里很多人用不完都直接把 api key 发出来了，而且传承了小米一贯营销套路，非要把单位拉大，花里胡哨一大堆就是能力拉跨。

minimax ，拉完了，以前我用官方订阅的 minimax-2.7 连 skill 都不会调用，m3 在我自己的 agent 工具里提示词遵循还不如 deepseek-v4-flash 。

顺带一提：
composer-2.5 的体验还挺好，量也足。

总结起来国产模型值得使用的就是 glm 、kimi 、deepseek 这三家。

Seddas

1 day ago

@ebushicao 感谢分享，你觉得 glm-5.2 跟 claude/codex 对比有什么感受？

ebushicao

1 day ago

@Seddas 没太多感受，主要的感受就是慢吧。还有就是 glm-5.2 和 claude code 的 opus 都是 1m 上下文，codex 的上下文大小限制有点难受。

huapaigu

1 day ago

确实感觉 Claude 更强一些，codex 日常主力用也没问题，搭配着来

zuosiruan

1 day ago via iPhone

codex xhigh 我体验下来非常强

limusi

1 day ago via iPhone

gemini 其实不差啊 code review 能抓到很骚的 bug

wolfie

1 day ago

@limusi
gemini 只能挑刺，编码很废物，跟 minimax 差不多。

chitanda

1 day ago

@ebushicao #1 zcode 是类似 codex 那种。其实 Claude 最好的地方是他的 Claude code 生态，那一堆 harness，越用越顺手。不知道 glm5.2 能否在 Claude code 里无感接手，实在受不了用的胆战心惊的 Claude 订阅了，如果 glm 能做到上面的生态，🐶都不买 Claude 的订阅

yaidev

1 day ago

说实话我自己在用 Codex 20x 和 Cursor Ultra + Claude 4.8 Opus （ HIGH)，这里面真正能拿长期拿来工作依赖的只有 Claude

Zenuncl

PRO

1 day ago

现在最好用的依然是 Claude 么？
用的什么客户端？ Claude Code vs Codex 么？有没有尝试统一一下客户端然后不同模型去测试么？很好奇结果

zephyru

21h 12m ago

mimo 个人感觉跑 agent 任务效果还行。
minimax 是真的拉完了。
两家都是量给的很足，不过写代码确实不如 deepseek 。
kimi 能力好但是订阅给的量少（不知道现在有没有改善）。
glm C 端则是又慢又买不到。
Claude 结合 Claude Code 的干活体验现在确实还是最好的。
开箱即用，整合度高，现成的 harness 或者基于 Claude Code 提供的能力去搭自己想要的 harness 体验都会好很多。主要人精力有限，虽然知道各家都有自己的客户端同时这些客户端都对自己家的模型有优化，但确实是没有动力去装一大堆。