• 请不要在回答技术问题时复制粘贴 AI 生成的内容
CloudSen
V2EX  ›  程序员

别买阿里 Token Plan [降智严重]

  •  1
     
  •   CloudSen · 6h 5m ago · 1803 views

    背景: 公司领导买了团队版的 Token Plan ,要团队大量使用。

    使用过程: 分别试用了一下测试了在 OpenCode 、CodeX 两个工具下的开发体验。

    结论: 降智十分严重,跟之前 OpenRouter 开放的试用模型来看,简直一个天上一个地下。工作用的话,纯给自己找不自在。

    主要体现在:

    • 固执己见: 明说了使用 A ,执行时还是用他认为的 B
    • 自我打脸: 分析时说 codex 的 exploer 子 agent 是只读默认,做方案时又说让 exploer 改文档
    • 不基于当前仓库工作: 工作空间命名时我的 skill git 仓库了,让它修改某个技能,结果还去~/.agent/skills/ 路径读取和修改。必须要非常明确给他说清楚。
    • 不遵守事实: 随意猜测,甚至偷懒什么都要用户提供,我都提供了,还要你干嘛?
    • git 仓库里让它撤销当前修改,结果它用 “cp xxx.backup ...”这种备份文件的方式,然后告诉你,抱歉我之前忘记创建 backup 备份文件了

    有图有真相,见我的 Awesome Qwen PPT:
    https://docs.google.com/presentation/d/1lW1Ahvk7cu2LrK048BPu-AW8ZgYmQNbJ/edit?usp=sharing&ouid=102801637491008662813&rtpof=true&sd=true

    Supplement 1  ·  33 mins ago

    测试都基于Token Plan中的Qwen3.6-plus。
    空了再试一下Deepseek V4和GLM5。

    20 replies    2026-05-14 19:02:46 +08:00
    Meursau1T
        1
    Meursau1T  
       4h 59m ago
    从体验上说,就算选 DeepSeek V4p 都没这么蠢
    Curtion
        2
    Curtion  
       4h 46m ago
    用的是哪个模型啊? 要避坑也得知道哪个模型比较差唉,要是用的 falsh 或者 minimax 那确实很正常
    Sundayz
        3
    Sundayz  
       4h 43m ago
    毕竟是阿里的产品,情有可原了
    stormtrooperx5
        4
    stormtrooperx5  
       4h 42m ago
    模型不会有任何量化,也不存在降智
    m1nm13
        5
    m1nm13  
       4h 38m ago
    怎么说呢?根据我用 cursor 用这模型的体验,它基本上只能做一些非常简单的活
    这个评价也送给所有国产模型,包括 GLM 之类的

    CC 没测试过
    saysssssss
        6
    saysssssss  
       4h 32m ago
    别的不说,google 在线文档右上角的访客头像还挺有意思的
    maocat
        7
    maocat  
       4h 31m ago
    token plan

    qwen3.6-plus

    发现 3000 端口被占用了,直接把我所有的 docker 全删除了

    zhoulouzi
        8
    zhoulouzi  
       4h 21m ago
    @maocat 哈哈哈 66666
    Lax
        9
    Lax  
       3h 55m ago
    不敢用。至今保留阿里云当年出事故后的手写道歉信,要是用它们的产品搞自动化更虾仁了
    jerry12547
        10
    jerry12547  
       3h 51m ago
    公司用的通义灵码企业版专属版,感觉还行哎
    MjSteed
        11
    MjSteed  
       3h 27m ago
    终于有人有同感了,当初 3.6 刚出的时候,体感上比 3.5 好太多,现在一个很简单的问题都要和它对线很久,而且经常忘记规范自由发挥
    jianggang199771
        12
    jianggang199771  
       3h 24m ago
    确实感觉有点明显,现在对话,有点太墨迹
    JasonYip
        13
    JasonYip  
       42 mins ago
    @maocat 看来不是个例了 上次让 qwen3.6plus 改一个前端页面 简单的需求直接来一句“I accidentally deleted too much. Let me rewrite the file properly.”误删了大批量代码
    CloudSen
        14
    CloudSen  
    OP
       38 mins ago
    @Curtion my bad ,忘记说明了,qwen-3.6-plus.
    CloudSen
        15
    CloudSen  
    OP
       37 mins ago
    @saysssssss 情怀拉满
    CloudSen
        16
    CloudSen  
    OP
       37 mins ago
    @maocat niubiest
    CloudSen
        17
    CloudSen  
    OP
       35 mins ago
    @stormtrooperx5 那是啥原因导致的呢?刚开始才放出 qwen3.6 的时候,确实能解决不少复杂问题,现在简单的做着都费劲
    shakaraka
        18
    shakaraka  
    PRO
       29 mins ago
    kimi 都比 qwen 好不知多少倍就现在这个时间点
    stormtrooperx5
        19
    stormtrooperx5  
       21 mins ago
    @CloudSen 如果想验证 可以直接走百炼按量付费的模型测一下
    stormtrooperx5
        20
    stormtrooperx5  
       18 mins ago
    比如 qwen3.6-plus-2026-04-02 这个是快照版本,如果两边确实效果不一样可以发工单喷他们
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3375 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 75ms · UTC 11:21 · PVG 19:21 · LAX 04:21 · JFK 07:21
    ♥ Do have faith in what you're doing.