wilddog
2.3D

现在有哪个国产大模型可以拿来踏踏实实的写代码了吗?

  •  
  •   wilddog · 8h 9m ago · 645 views
    不至于达到 CC 或者 codex 的水平,就是能作为生产力用。

    现在有吗?
    22 replies    2026-06-02 02:25:38 +08:00
    testsb
        1
    testsb  
       8h 4m ago   ❤️ 1
    综合排名: https://arena.ai/leaderboard/text/overall
    专家排名(任务规划): https://arena.ai/leaderboard/text/expert
    编码排名: https://arena.ai/leaderboard/text/coding

    qwen3.7-max-preview 、glm-5.1 、mimo-v2.5-pro 、kimi-k2.6 都还不错
    wilddog
        2
    wilddog  
    OP
       7h 48m ago
    @testsb 看排名没意义,我想问大家是不是真的有实际在生产工作中去用这些模型,反馈如何
    est
        3
    est  
       7h 47m ago
    mimo 2.5 pro 我觉得还行。
    wilddog
        4
    wilddog  
    OP
       7h 45m ago
    @est 能达到 cc 或者 codex 比较早期版本的使用体验吗
    est
        5
    est  
       7h 37m ago
    @wilddog 没有。 我 vibe 入场较晚。(主要是穷惯了喜欢白嫖)
    cs10086
        6
    cs10086  
       7h 36m ago
    deepseek 可以吧
    NewYear
        7
    NewYear  
       7h 36m ago
    写代码可以的

    就怕不定期降智,bug 数量突然爆发
    testsb
        8
    testsb  
       7h 34m ago
    @wilddog https://v2ex.com/t/1210455

    Arena 排名其实还是挺有参考价值的,基本跟大多数人体感近似
    testsb
        9
    testsb  
       7h 28m ago
    OpenCode GO 基本几大 TOP 国模都能用,新用户首月半价 5 刀 ZFB 能付,可以自己实际都体验一下
    zisen
        10
    zisen  
       7h 23m ago
    glm5.1 上下文超过 150k 在 opencode 里面就会开始胡言乱语,表现为一直重复一句话,乱码,思考内容跑到回答里面,循环思考等等,100k 以内上下文还算稳定
    deepseek 智商不稳定一会聪明一会能把你气个半死,而且很喜欢直接帮你改代码或者操作设备,只是问个问题就开始改代码
    gpt5.4 是最通人性的基本上意图都能判断对
    minimax 纯搞笑的用不得
    其他的没咋用过
    shakaraka
        11
    shakaraka  
    PRO
       7h 19m ago
    kimi2.6 目前已经很可以了,699 可以用好几天
    wilddog
        12
    wilddog  
    OP
       7h 16m ago
    @zisen get 这个是真经验
    wilddog
        13
    wilddog  
    OP
       7h 16m ago
    @shakaraka 哈?你是在嘲讽他是吧
    wilddog
        14
    wilddog  
    OP
       7h 15m ago
    @testsb 我一直都在用 cc codex gemini,国产大模型会把我气死吗
    wilddog
        15
    wilddog  
    OP
       7h 15m ago
    @cs10086 工作生产用过了吗,可以稳定输出吗
    shakaraka
        16
    shakaraka  
    PRO
       6h 58m ago
    @wilddog #13
    testsb
        17
    testsb  
       6h 53m ago   ❤️ 1
    @wilddog 国模做 Plan 差点,最好用 cc/codex 做规划,然后让国模执行。GLM 总体不错不过就像 10 楼的兄弟说的那样上下文太小了做不了太复杂、占更多 context 的任务。

    国内外主流模型混用和相互的替代性,可以参考 omo 对各模型特点的描述和角色的划分:
    https://github.com/code-yeongyu/oh-my-openagent/blob/dev/docs/guide/agent-model-matching.md

    不过 omo 不是所有国模都涉及到了,而且有些也不是最新版本,应该是因为要做严格的适配性测试所以纳入的比较慢
    dingawm
        18
    dingawm  
       6h 48m ago
    经典小马过河的问题,每个人的感受可能都不太一样,反正现在应该是基本离 Opus 4.6/GPT 5.4 还差点的水平
    不行充点钱试试 DeepSeek ,反正按量付费,要是感觉完全接受不了,那其他的国产模型也不用试了
    wilddog
        19
    wilddog  
    OP
       5h 21m ago
    @shakaraka 699 是月费还是年费
    wilddog
        20
    wilddog  
    OP
       5h 20m ago
    @testsb 大概能 get 到了
    wilddog
        21
    wilddog  
    OP
       5h 19m ago
    @dingawm 我想问的就是差多少
    差 10%=能用
    差 20%=将就着用
    差 30%但是足够便宜=捏着鼻子用
    差 50%=完全不可用

    你的意思是 DeepSeek 目前是国产模型编程能力最强的吗
    wangtufly
        22
    wangtufly  
       4h 25m ago via Android
    梁圣在大 A 割你韭菜,在模型上补贴回来。这不赶紧蹬,捞回本
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1065 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 22:50 · PVG 06:50 · LAX 15:50 · JFK 18:50
    ♥ Do have faith in what you're doing.