V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
junwind
V2EX  ›  程序员

glm5.1, kimi2.6, minimax2.7, mimo v2.5, deepseek v4,编程能力上的排名如何?

  •  
  •   junwind · 4 小时 53 分钟前 · 1239 次点击

    先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6

    第 1 条附言  ·  3 小时 4 分钟前

    以一个案例来分析这几个的能力:帮我生成一个天气查询H5应用 提示词就这一句,都一样。

    glm5.1: https://imgchr.com/i/pehcWCR 天气温度假

    kimi2.6:https://imgchr.com/i/pehczKf 天气温度真

    minimax2.7:https://imgchr.com/i/pehcBvV 拉完了

    mino v2.5 : 第一遍没有给我生成,换提示词:帮我开发一个天气查询H5应用。才继续生成:https://imgchr.com/i/pehgQIJ 天气温度假。 有一个背景下雨的效果

    deepseek v4: https://imgchr.com/i/pehcgUJ 温度真

    仅针对这个案例的评价:glm5.1,kimi2.6 可以, deepseek v4 ,mino v2.5 次之。 minimax2.7 什么玩意?

    大家也可以自己测试下。

    第 2 条附言  ·  3 小时 0 分钟前
    根据案例实测,纠正我之前的排名:glm5.7 >= kimi2.6 >= deepseek v4 > mimo v2.5
    附:minimax 不配上桌。
    第 4 条附言  ·  2 小时 31 分钟前
    接评论区的要求,增加 qwen
    Qwen3.5 : https://pic1.imgdb.cn/item/69eddd196dcdaf678a8bc75c.png 和 minimax 一样,拉。
    Qwen3.6-plus: https://pic1.imgdb.cn/item/69edddbc6dcdaf678a8bc7d4.png
    Qwen3-coder 模式: https://pic1.imgdb.cn/item/69eddeb36dcdaf678a8bc93c.png
    这次的案例实测,都是用的官网的网页版,使用最新的模型测试。

    其它的模型,大家感兴趣的,可以自己测试一下。

    总结:国产模型第一梯队 glm ,kimi ,第二梯队:deepseek ,mimo , 第三梯队:qwen ,minimax 。
    26 条回复    2026-04-26 20:07:47 +08:00
    canyue7897
        1
    canyue7897  
       3 小时 49 分钟前 via iPhone
    我觉得 kimi 还可以哈?
    没想到这么拉?
    onedge
        2
    onedge  
       3 小时 42 分钟前
    GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
    cookii
        3
    cookii  
       3 小时 40 分钟前 via Android
    minimax 不配上榜好吧,夸张点说 4B 模型水平
    BestEicky
        4
    BestEicky  
       3 小时 31 分钟前
    @cookii 说是 4B 模型都抬举它了,应该是 SB 模型水平吧
    uqf0663
        5
    uqf0663  
       3 小时 29 分钟前
    kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
    onedge
        6
    onedge  
       3 小时 23 分钟前
    @uqf0663 minimax 已经完全龙虾了,m2.5 刚出我还觉得能力可以的,2.7 真的废了
    ayasealter570
        7
    ayasealter570  
       3 小时 18 分钟前
    minimax 官方订阅的极速版,智力低到没边了
    huaweii
        8
    huaweii  
       3 小时 16 分钟前 via Android
    @ayasealter570 有没有例子看看,好奇
    uqf0663
        9
    uqf0663  
       3 小时 6 分钟前
    @onedge 我就是用这龙虾的,m2.7 真的是连应付龙虾基本运行都有坑,目前我的龙虾只有 k2.6 勉强马马虎虎能凑合用。
    junwind
        10
    junwind  
    OP
       3 小时 3 分钟前
    @canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
    junwind
        11
    junwind  
    OP
       2 小时 59 分钟前
    @canyue7897 kimi 不拉,是我个人的武断,实测后还不错
    drealism
        12
    drealism  
       2 小时 59 分钟前 via Android
    可以把 qwen 系列补一个进去么🤜🤛
    Miofly
        13
    Miofly  
       2 小时 28 分钟前
    https://tools.wflynn.cn/tools/videotools/video-nologo?time=1777197004192 免费去各大平台图片、视频水印,支持小红书,抖音、快手等常用平台,感谢使用,感谢作者大大
    whileFalse
        14
    whileFalse  
       2 小时 24 分钟前
    ebushicao
        15
    ebushicao  
       1 小时 31 分钟前
    每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
    aes114514gcm
        16
    aes114514gcm  
       1 小时 25 分钟前
    和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
    zenfsharp
        17
    zenfsharp  
       1 小时 20 分钟前
    GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
    我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。
    zenfsharp
        18
    zenfsharp  
       1 小时 19 分钟前
    不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
    lukaktus6768
        19
    lukaktus6768  
       47 分钟前
    看到 glm 我就要踩一脚,买谁都不要买他
    Miofly
        20
    Miofly  
       44 分钟前
    感觉 DeepSeek 还是编程的神,GLM 真的能排到第一位吗 https://tools.wflynn.cn/tools/videotools/video-nologo?time=1777203245705 免费去各大平台图片、视频水印,支持小红书,抖音、快手等常用平台,感谢使用,感谢作者大大
    anmie
        21
    anmie  
       41 分钟前
    @zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
    这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。

    我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。)
    metalvest
        22
    metalvest  
       39 分钟前
    GLM5.1 天气温度假,为什么排第一?
    sddyzm
        23
    sddyzm  
    PRO
       28 分钟前
    @Miofly
    @Livid spam
    weilongs
        24
    weilongs  
       26 分钟前
    minimax2.7 排不到那个位置.
    Desiree
        25
    Desiree  
       25 分钟前
    暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
    zzz123456qqq
        26
    zzz123456qqq  
       10 分钟前
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2887 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 93ms · UTC 12:18 · PVG 20:18 · LAX 05:18 · JFK 08:18
    ♥ Do have faith in what you're doing.