V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
fingerxie
V2EX  ›  程序员

感觉 Kimi tinking 吹的很厉害,使用起来差强人意

  •  1
     
  •   fingerxie · 2025 年 11 月 8 日 · 6350 次点击
    这是一个创建于 69 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一直以来都用 claude code ,今天听说 kimi thinking 很强,甚至高于 gpt5,我就去付费试了试。

    试完以后的结论就是:

    1. 他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
    2. 代码能力还行,修改东西还算可以接受
    3. 工具运用能力不太行,明明要给我展示一段代码,但是用成了修改代码的工具,吓得我赶紧拒绝

    这是我使用了一段时间的个人感受,不代表任何客观情况。

    希望国产 AI 越做越好

    40 条回复    2025-11-12 16:22:22 +08:00
    ethanwan9
        1
    ethanwan9  
       2025 年 11 月 8 日   ❤️ 8
    差强人意: 表示大体上还可让人满意。
    yanyuechuixue
        2
    yanyuechuixue  
       2025 年 11 月 8 日
    我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起,kimi 的表现并不如意。
    ethanwan9
        3
    ethanwan9  
       2025 年 11 月 8 日
    另: Kimi Thinking
    fingerxie
        4
    fingerxie  
    OP
       2025 年 11 月 8 日
    @ethanwan9 客气一下而已。不好用
    fingerxie
        5
    fingerxie  
    OP
       2025 年 11 月 8 日
    @ethanwan9 拼写错了 尬了~
    daweii
        6
    daweii  
       2025 年 11 月 8 日 via iPhone   ❤️ 4
    歪个楼,我现在每次看到“差强人意”我都要停下来想想这用对没🤔。

    语言是活的,估计这个词很快就跟“空穴来风”一样,本来正确的意思是有根据,但是大家都在说明没有根据的时候用,最后反倒是错误用法占了上风成了主流意思。
    netherder
        7
    netherder  
       2025 年 11 月 8 日 via Android
    Claude.md 不是 claude 的配置吗 你应该让他指定读取吧
    5ssl
        8
    5ssl  
       2025 年 11 月 8 日
    用着好像还可以
    Seck
        9
    Seck  
       2025 年 11 月 8 日
    v2 不是刚冲进来好几个暗广吗?

    一到实战就抓瞎,习惯了
    Bantes
        10
    Bantes  
       2025 年 11 月 8 日
    TRAE 才搞笑。
    fingerxie
        11
    fingerxie  
    OP
       2025 年 11 月 8 日
    @lightmanlu 因为用的是 claude code ,只是 kimi 模型
    Saniter
        12
    Saniter  
       2025 年 11 月 8 日
    @daweii 感觉现在大部分人还是知道差强人意的意思的,比如 op 就是表达原意。

    之前用错的挺多,近几年好像纠正的差不多了
    laminux29
        13
    laminux29  
       2025 年 11 月 8 日
    我自己感觉,

    Kimi 就是比国内的 deepseek 与 豆包 差一点。

    Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。
    KingFong
        14
    KingFong  
    PRO
       2025 年 11 月 8 日 via iPhone
    已经不敢在公开场合使用“差强人意”这个成语了。
    tlerbao
        15
    tlerbao  
       2025 年 11 月 8 日
    国产都是狗屎,我把话放这 ,包括 GLM4.6
    Wenwener
        16
    Wenwener  
       2025 年 11 月 8 日
    kimi 用了七百额度 转 cc 之后 很多 bug 一轮就能修好 kimi 改半天改不好
    ysy950803
        17
    ysy950803  
       2025 年 11 月 8 日   ❤️ 1
    考试高分的学霸,实操不一定最强,道理就是这么简单。我平时遇到编程难题时,都是各个 LLM 都试一遍,每次满意的可能并不是同一个模型。
    gunner168
        18
    gunner168  
       2025 年 11 月 8 日 via iPhone
    @daweii 在我认知里,差强人意就是不太满意,通俗点就是不行
    xing7673
        19
    xing7673  
       2025 年 11 月 8 日
    他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
    这里指的是它完全忽略了规则,还是说它有看到规则但是没有按照规则去执行?
    这种情况我之前在 grok fast 那个模型上也看到过
    感觉模型对应用环境不敏感
    looplj
        20
    looplj  
       2025 年 11 月 8 日
    可以看下是不是开了 thinking 模式,thinking 是要单独开的,不开好像不走 thinking 。
    和 MimiMax-M2 不一样,M2 是一定会 thinking 的。
    xiaoming1992
        21
    xiaoming1992  
       2025 年 11 月 8 日 via Android
    没感觉“差强人意”错多少啊,用在这里表达“勉强还行、过得去、一般般”也说得过去吧
    rick13
        22
    rick13  
       2025 年 11 月 8 日
    上午用了下,跟 gemini 简单对比下,差了点,但没差太多,不过都是免费我肯定用更好的
    xiaoming1992
        23
    xiaoming1992  
       2025 年 11 月 8 日 via Android
    gpt 给的例句:
    这次考试成绩差强人意,比上次稍微好一些,但还不是很理想。
    他的表演差强人意,总体还可以,但还有提升空间。
    跟本 post 语意基本相符。
    PrinceofInj
        24
    PrinceofInj  
       2025 年 11 月 8 日
    @daweii 空穴来风很容易根据语境来判断正确的意思,但是差强人意就不一样了。本意和误用本来就是达不到预期的意思,只不过本意是基本上还凑活,误用是完全不行。这种没办法根据语境来判断的不可能成为约定俗成的惯用。就像阀值永远不可能成为阈值异体一样。
    clarkethan
        25
    clarkethan  
       2025 年 11 月 8 日
    刷分高手
    usVexMownCzar
        26
    usVexMownCzar  
       2025 年 11 月 8 日 via iPhone
    目前别对国产 ai 抱太大希望。有钱还是 Claude openai Gemini 。国产 ai 目前只能替补,做做简单的工作。
    lisongeee
        27
    lisongeee  
       2025 年 11 月 8 日
    - 差强人意
    - 因为 XXX 的原因

    我每隔几天就在互联网上能看到这俩
    r6Vm94FFk9u3W6XI
        28
    r6Vm94FFk9u3W6XI  
       2025 年 11 月 8 日
    我今天也用了一天,我觉得不错,写代码的质量,跟 claude4.5 sonnet 和 gemini 2.5pro 差不多
    RandyLuo
        29
    RandyLuo  
       2025 年 11 月 9 日
    你确定开了 thinking?目前感觉还挺好用的(之前一直用 gpt-5-high 和 claude-opus 4.1 )。工具调用能力也很强
    cue
        30
    cue  
       2025 年 11 月 9 日 via iPhone
    V 站卧龙凤雏真多,很多成语就是在使用过程中改变了意思的啊,央视体育频道就经常说一个球员表现不佳说是差强人意,也就比如卧龙凤雏,语言就是用来沟通的,知道表达什么就 OK 了,天天纠结今非昔比、差强人意这些不觉得蛋疼?

    另外,kimi 和 minimax 俩真的烂得大相径庭呢。(狗头)
    orangleliu624
        31
    orangleliu624  
       2025 年 11 月 9 日 via Android
    知道了 不太行
    FlashEcho
        32
    FlashEcho  
       2025 年 11 月 9 日
    你是不是看了很多营销号被骗了,kimi k2 刚出来确实有一堆这种宣传,还有 claude 开了 max plan 不直接用 claude code 改用 kimi k2 这种搞笑案例

    下次建议看下稍微客观点的评测:

    https://livebench.ai/#/

    https://lmarena.ai/leaderboard
    johnnyyeen
        33
    johnnyyeen  
       2025 年 11 月 9 日
    有没有觉得最近更新的 codex 已经开始要超过 claude code 了。
    saymoon
        34
    saymoon  
       2025 年 11 月 9 日
    还有一个点是国内这些厂商的编程套餐看似定价便宜,例如 kimi 49/月档对标 CC $20/月档,实际赠送的可以在 Claude 或它自家 Cli 工具的使用额度( Kimi For Coding API Key ) 1024 次/周(还是限时优惠),实际使用不了多长时间,如果中等强度使用大概 1-2 天就用完了,还有 qwen 这个价格刺客。实际算下来并不比 CC 便宜,综合使用成本反而更高。
    bingfengfeifei
        35
    bingfengfeifei  
       2025 年 11 月 9 日
    @xiaoming1992 #21 主要是这个词语误用占大多数,所以当看到这个词的时候,不太清楚作者本意到底想要表达什么。
    bwnjnOEI
        36
    bwnjnOEI  
       2025 年 11 月 10 日 via iPhone
    月之暗面好像没出过 Kimi tinking 这个模型,最近出的是 kimi k2 thinking
    visper
        37
    visper  
       2025 年 11 月 10 日
    差强人意我感觉起来也没觉得用错啊。勉强来说,要求不太高的话,大致上还行。但是没有吹的那么厉害。
    sagnitude
        38
    sagnitude  
       2025 年 11 月 10 日
    让他翻译几个 java bean 到 c++,我已经等了 50 分钟,现在扣了 5 块钱,还没蹦出 10 行有效代码

    再等会,等到一个小时再不出东西就关掉换回 cc 了
    815377546
        39
    815377546  
       2025 年 11 月 11 日
    @FlashEcho #32 我也怀疑是这些大 up 都收钱了。 不过国外好像还真评价不错? 不知道怎么回事
    haoxiaoru
        40
    haoxiaoru  
       2025 年 11 月 12 日
    @FlashEcho livebench 上看,跟 DeepSeek V3.2 得分差不多,稍差一丢丢:71.64 vs 71.56 ,国内的 top2
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2667 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 04:46 · PVG 12:46 · LAX 20:46 · JFK 23:46
    ♥ Do have faith in what you're doing.