Seddas
V2EX  ›  Claude

Claude vs Codex vs Gemini

  •  
  •   Seddas · 1 day ago · 3104 views

    搞些个人兴趣项目,三个 coding agent 都用了不少,我只是做简单的工具类小项目,就有很直观的体验。

    Gemini 经常胡言乱语,改的一堆 bug ,反反复复跟他拉锯才能改对,心很累,挂上一些 harness 也不管用,感觉就跟弱智对话一样。虽然 token 量大管饱,但大项目真有人用这玩意吗

    Codex 好很多,但是有时候也要反复几次才改对,前端经常出些小问题,但是提醒一下也能改对

    三个里面最好用的还是 Claude ,虽然$20 的 plan 5h session 经常两三个大的改动就耗光了,但是出的成果质量高很多,不需要一个劲的 follow up ,经常能找到 Codex 找不到的 bug

    现在我有 Claude 和 Codex $20 plan 。我拿 Claude 做大改动,code audit ,code review; Claude 额度用完了就用 Codex. Gemini 是 Google Drive 的 plan 送的,我只用它来做些确定性高的重复劳动

    有没有人说说国产模型的使用体验?

    25 replies    2026-06-27 23:48:19 +08:00
    ebushicao
        1
    ebushicao  
       1 day ago   ❤️ 7
    glm-5.2 搭配 zcode 算是国内能力最好的了,缺点是不支持多模态,而且官方 coding plan 抢不到,我是用的 opencode go 订阅。

    kimi 的优势是支持多模态,前端页面写的还行,但能力还是差了点,kimi-2.7 有时候感觉比 kimi-2.6 还差一些。

    deepseek 能力一般,但价格便宜并发还高,简单任务很适合。

    qwen3.7-max ,拉完了,官方吹的太高,实际依托答辩,一些简单的 deepseek-v4-flash 都能做好的事居然也会出错。

    mimo ,拉完了,首发我就买了,能力不如 deepseek ,唯一好点的就是非 pro 模型支持多模态,V 站里很多人用不完都直接把 api key 发出来了,而且传承了小米一贯营销套路,非要把单位拉大,花里胡哨一大堆就是能力拉跨。

    minimax ,拉完了,以前我用官方订阅的 minimax-2.7 连 skill 都不会调用,m3 在我自己的 agent 工具里提示词遵循还不如 deepseek-v4-flash 。

    顺带一提:
    composer-2.5 的体验还挺好,量也足。

    总结起来国产模型值得使用的就是 glm 、kimi 、deepseek 这三家。
    Seddas
        2
    Seddas  
    OP
       1 day ago
    @ebushicao 感谢分享,你觉得 glm-5.2 跟 claude/codex 对比有什么感受?
    ebushicao
        3
    ebushicao  
       1 day ago
    @Seddas 没太多感受,主要的感受就是慢吧。还有就是 glm-5.2 和 claude code 的 opus 都是 1m 上下文,codex 的上下文大小限制有点难受。
    huapaigu
        4
    huapaigu  
       1 day ago
    确实感觉 Claude 更强一些,codex 日常主力用也没问题,搭配着来
    zuosiruan
        5
    zuosiruan  
       1 day ago via iPhone
    codex xhigh 我体验下来非常强
    limusi
        6
    limusi  
       1 day ago via iPhone
    gemini 其实不差啊 code review 能抓到很骚的 bug
    wolfie
        7
    wolfie  
       1 day ago
    @limusi
    gemini 只能挑刺,编码很废物,跟 minimax 差不多。
    chitanda
        8
    chitanda  
       1 day ago
    @ebushicao #1 zcode 是类似 codex 那种。其实 Claude 最好的地方是他的 Claude code 生态,那一堆 harness,越用越顺手。不知道 glm5.2 能否在 Claude code 里无感接手,实在受不了用的胆战心惊的 Claude 订阅了,如果 glm 能做到上面的生态,🐶都不买 Claude 的订阅
    yaidev
        9
    yaidev  
       1 day ago
    说实话我自己在用 Codex 20x 和 Cursor Ultra + Claude 4.8 Opus ( HIGH),这里面真正能拿长期拿来工作依赖的只有 Claude
    Zenuncl
        10
    Zenuncl  
    PRO
       1 day ago
    现在最好用的依然是 Claude 么?
    用的什么客户端? Claude Code vs Codex 么?有没有尝试统一一下客户端然后不同模型去测试么?很好奇结果
    zephyru
        11
    zephyru  
       21h 12m ago   ❤️ 1
    mimo 个人感觉跑 agent 任务效果还行。
    minimax 是真的拉完了。
    两家都是量给的很足,不过写代码确实不如 deepseek 。
    kimi 能力好但是订阅给的量少(不知道现在有没有改善)。
    glm C 端则是又慢又买不到。
    Claude 结合 Claude Code 的干活体验现在确实还是最好的。
    开箱即用,整合度高,现成的 harness 或者基于 Claude Code 提供的能力去搭自己想要的 harness 体验都会好很多。 主要人精力有限,虽然知道各家都有自己的客户端同时这些客户端都对自己家的模型有优化,但确实是没有动力去装一大堆。
    Greenm
        12
    Greenm  
       20h 27m ago
    gemini 俗称美国豆包,啥也干不了,扯扯淡还行。 真干活也就是 cc, codex, glm 。
    layxy
        13
    layxy  
       20h 8m ago
    gemini 前端审美很好,使用 codex 和 claude 设计页面,codex 真是一言难尽,丑就算了交互也是一坨,claude 中等吧,gemini 设计的就很符合预期,就是 pro 额度不太够用,最近改版了好像耐用很多
    siddharth
        14
    siddharth  
       18h 47m ago
    个人感觉跟你是一样的。5h 的额度先把 codex 用完,然后再用 gemini 磨一磨洋工。
    kuhung
        15
    kuhung  
       18h 46m ago
    个人感觉 cursor 里面的 Claude 比 Claude code 里面的能力更强,不知道是 cursor 的脚手架写得好,还是因为 cursor 注入了更多的我的编码习惯。
    SethShi
        16
    SethShi  
       18h 37m ago
    Claude Code 的 UltraCode 最爽的是是开几十上百个 subagent 去做对抗分析, 在排查问题, 验证事情的时候很舒服
    Lemonyi
        17
    Lemonyi  
       18h 25m ago
    本人大厂工作经验,内部使用 Claude Code ,适合大型项目,超长上下文,复杂业务逻辑分析能力很强,bug 少,就是套餐比较贵,看项目的价值了,价值高的话可以用 CC
    qxmqh
        18
    qxmqh  
       18h 5m ago   ❤️ 1
    就像一楼说的 zcode+glm5.2 是目前比较好的方法,我是 zcode+火山的 pro 订阅,用起来感觉非常好,就是消耗挺快,从实际应用上来看,完全不输 Codex+5.5 。我基本上用完 codex,就无缝切换 zcode+5.2 。 非常丝滑。
    fxjson
        19
    fxjson  
       17h 54m ago
    我就想问问你们都在国外吗,claude code 不封吗
    JoeSmith
        20
    JoeSmith  
       17h 3m ago
    @kuhung Token 消耗的性价比呢? Cursor 给的 Claude 模型额度是不是比 Claude Code 订阅的额度少很多?
    idragonet
        21
    idragonet  
       16h 3m ago
    gemini 是主力!没办法就他家 PRO 便宜。
    kuhung
        22
    kuhung  
       14h 42m ago
    @JoeSmith 我是老的 500 次,可以用 250 次 Claude opus 。优点是上下文可以使劲塞,缺点就是要想清楚干啥,补充另算次数。Claude code 就无所谓了,关注 token 数而不是次数。
    xqqiu137a1220
        23
    xqqiu137a1220  
       10h 10m ago
    个人使用习惯和技巧还是占很大一部分的,cc 确实好用,codex 我更多拿来作为方案设计、检查、测试使用
    BigShot404
        24
    BigShot404  
       9h 42m ago
    我用下来感觉就编程而言,国产的模型已经没有短板了,用 trae+火山 plan ,qoder+qwen3.7max ,还没有无法胜任的情况。甚至就火山 plan 里的那个 auto 都在绝大多数情况下 OK ,只有找 bug 我现在才开 GLM5.2
    robinxplorer
        25
    robinxplorer  
       5h 33m ago
    @BigShot404 国产模型已然起飞。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   878 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 21:22 · PVG 05:22 · LAX 14:22 · JFK 17:22
    ♥ Do have faith in what you're doing.