V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
inyfee
V2EX  ›  程序员

从之前的反重力账号不能用了之后,我试用了一个星期的 kimi k2.5,评价是不好用

  •  
  •   inyfee · 1 天前 · 1694 次点击

    重度使用了一个星期的 kimi 2.5 ,写代码太傻了,做 plan 也太傻了。我有一个简单的需求,搞了一个下午还没有搞定。

    受不子之后,刚又去搞了一个反重力的账号,不到半个小时,工作效果大约满意。

    难道是我没有用错,提示词是完全一样的

    23 条回复    2026-02-06 19:21:54 +08:00
    qW7bo2FbzbC0
        1
    qW7bo2FbzbC0  
       1 天前
    反重力权益的 g3-flash 反代到 openclaw 里面总是一会儿就被限流了,也配了免费的 nvidia kimi2.5 ,真的差距好大
    iorilu
        2
    iorilu  
       1 天前
    本来就不行阿

    难道有人认为这个能和 Gemini 模型比了
    UserTRI
        3
    UserTRI  
       1 天前
    我在思考你这个受不子是什么场景下打错字的。
    xiaowoli
        4
    xiaowoli  
       1 天前   ❤️ 1
    据我使用的观察,目前国内最强的模型是 qwen3 ,和 gemini3 差距大概在半年左右的水平,其他国内模型,呵呵
    msn1983aa
        5
    msn1983aa  
       1 天前
    @qW7bo2FbzbC0 #1 #1 英伟达的 kimi2.5 限流不?
    Rorysky
        6
    Rorysky  
       1 天前
    @xiaowoli 好多吹 kimi 2.5 还有 GLM 的,甚至还有吹豆包的。真的假的
    midsolo
        7
    midsolo  
       1 天前
    挂我是吧,下班别走
    qiuxuqin
        8
    qiuxuqin  
       1 天前
    我也用了一星期的 kimi2.5 了,我也觉得不行,比不过 Gemini 。但是 Gemini 经常限流,重新访问失败,所以我是结合着用。
    yjhatfdu2
        9
    yjhatfdu2  
       1 天前
    我都用的 opencode 连接官方的收费 API ,试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢,反复错误修复不正确,而且关于任务的理解就很不到位。M2.1 虽然也不算出色(和 GPT5.2 、opus 比),但是快、基本可以正确
    doctorzry
        10
    doctorzry  
       1 天前 via Android
    牛不牛不知道,牌头是很大。Kimi 2.5 是我见过的国产模型里面,少数的你在官网 web 端去手动对话调用,都能给你降级模型,让你充钱才能用它的 thinking 模型的
    yeziahehe
        11
    yeziahehe  
       1 天前
    反重力账号是搭车的吗?
    cnhongwei
        12
    cnhongwei  
       1 天前
    @UserTRI #3 应是使用五笔输入法,一卡就错了。 了是 b ,子是 bb 。
    这两天使用 codex ,感觉比 antigravity 更爽,输入要求,再 commit 点一下就行了。
    cnhongwei
        13
    cnhongwei  
       1 天前
    codex 现在是免费账号也可以使用,感觉给的用量还比较大。
    nkcfc
        14
    nkcfc  
       1 天前
    意料之中,我也试过了,感觉 kimi 还需要进步,还到不了第一梯队。
    badreamm
        15
    badreamm  
       1 天前
    用 codex 吧
    xiaowoli
        16
    xiaowoli  
       21 小时 0 分钟前   ❤️ 1
    @Rorysky
    chat-GPT ,gemini ,claude 独一当,相当于元婴水平
    qwen3----- 差不多结丹后期
    deepseek----- 结丹中期
    Kimi2.5 ,豆包----- 结丹中期都够不到
    laved
        17
    laved  
       20 小时 49 分钟前
    歪个楼,看了这么多帖子,我用了一下 opencode 提供的免费模型有一个 minimax 2.1 的模型,怎么站内没有讨论一下 minimax 这家的模型
    zhi8023nan
        18
    zhi8023nan  
       20 小时 29 分钟前
    @xiaowoli MiniMax2.1 可以吗?好多人说这个还行,GLM4.7 评价也不好
    zhi8023nan
        19
    zhi8023nan  
       20 小时 27 分钟前
    @laved 确实没有 MiniMax2.1 的,不清楚到底好不好
    xiaowoli
        20
    xiaowoli  
       18 小时 51 分钟前
    @zhi8023nan #18 没用过,但是说好用的大概率是广
    zeroDev
        21
    zeroDev  
       18 小时 6 分钟前 via iPhone
    k2.5 国产调用 playwright 处理网页是最快速不拖拉的
    jasonjie2015
        22
    jasonjie2015  
       17 小时 0 分钟前
    国产的大模型推广费可能都不低,每次新版本出来,全网都是夸,都是超越 Claude 主流版本,然后一试用,比 Gemini 差的都远。国产的能用在开发上的我觉得只有 qwen coder 还能用。
    cellsyx
        23
    cellsyx  
       11 小时 16 分钟前
    国产大模型的推广力度都快赶上手机圈数码宝贝了. 如果说手机这种产品在现阶段还能凑合用, 辅助编程的模型真是差一点都有明显感知. 因为模型输出质量会直接影响工作效率, 低质量输出造成的额外无意义 debug 环节会造成工时成倍的浪费. 因此用惯好的模型是不可能将就的. 目前门槛也就是 Gemini 3 pro/flash, 要是一个功能实现之后有错误, 让他连续两次 debug 都不过就直接回退换 claude opus 4.5. 除非是做大模型评测, 不然没必要给自己找不自在.
    当然国产模型也有优点, 比如那些开源的模型用在一些本地执行的轻量级任务就很不错, 国产模型对于中文的识别也会好一点.
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   906 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 22:38 · PVG 06:38 · LAX 14:38 · JFK 17:38
    ♥ Do have faith in what you're doing.