别买阿里 Token Plan [降智严重]

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 62 days ago, the information mentioned may be changed or developed.

背景：公司领导买了团队版的 Token Plan ，要团队大量使用。

使用过程：分别试用了一下测试了在 OpenCode 、CodeX 两个工具下的开发体验。

结论：降智十分严重，跟之前 OpenRouter 开放的试用模型来看，简直一个天上一个地下。工作用的话，纯给自己找不自在。

主要体现在：

固执己见: 明说了使用 A ，执行时还是用他认为的 B
自我打脸: 分析时说 codex 的 exploer 子 agent 是只读默认，做方案时又说让 exploer 改文档
不基于当前仓库工作: 工作空间命名时我的 skill git 仓库了，让它修改某个技能，结果还去~/.agent/skills/ 路径读取和修改。必须要非常明确给他说清楚。
不遵守事实: 随意猜测，甚至偷懒什么都要用户提供，我都提供了，还要你干嘛？
git 仓库里让它撤销当前修改，结果它用 “cp xxx.backup ...”这种备份文件的方式，然后告诉你，抱歉我之前忘记创建 backup 备份文件了

有图有真相，见我的 Awesome Qwen PPT:
https://docs.google.com/presentation/d/1lW1Ahvk7cu2LrK048BPu-AW8ZgYmQNbJ/edit?usp=sharing&ouid=102801637491008662813&rtpof=true&sd=true

Supplement 1 · May 14

测试都基于Token Plan中的Qwen3.6-plus。
空了再试一下Deepseek V4和GLM5。

Supplement 2 · May 15

GLM5.1 页测试了。
让使用 tree.js + postprocessing 复刻一个 reactbit 的 grid scan 动态背景。
嘎嘎一顿遭，啥测试都测了，给你说没问题了。
打开页面一看，并没任何变化，也是笑了。
其他的就不测试了。

总结：
慢走不送。

token

开发

体验

39 replies • 2026-05-16 00:08:34 +08:00

Meursau1T

May 14

从体验上说，就算选 DeepSeek V4p 都没这么蠢

Curtion

May 14

用的是哪个模型啊? 要避坑也得知道哪个模型比较差唉，要是用的 falsh 或者 minimax 那确实很正常

Sundayz

May 14

毕竟是阿里的产品，情有可原了

stormtrooperx5

May 14

模型不会有任何量化，也不存在降智

m1nm13

May 14

怎么说呢？根据我用 cursor 用这模型的体验，它基本上只能做一些非常简单的活
这个评价也送给所有国产模型,包括 GLM 之类的

CC 没测试过

saysssssss

May 14

别的不说，google 在线文档右上角的访客头像还挺有意思的

maocat

May 14

token plan

qwen3.6-plus

发现 3000 端口被占用了，直接把我所有的 docker 全删除了

zhoulouzi

May 14

@maocat 哈哈哈 66666

Lax

May 14

不敢用。至今保留阿里云当年出事故后的手写道歉信，要是用它们的产品搞自动化更虾仁了

jerry12547

May 14

公司用的通义灵码企业版专属版，感觉还行哎

MjSteed

May 14

终于有人有同感了，当初 3.6 刚出的时候，体感上比 3.5 好太多，现在一个很简单的问题都要和它对线很久，而且经常忘记规范自由发挥

guobaorou

May 14

确实感觉有点明显，现在对话，有点太墨迹

JasonYip

May 14

@maocat 看来不是个例了上次让 qwen3.6plus 改一个前端页面简单的需求直接来一句“I accidentally deleted too much. Let me rewrite the file properly.”误删了大批量代码

CloudSen

May 14

@Curtion my bad ，忘记说明了，qwen-3.6-plus.

CloudSen

May 14

@saysssssss 情怀拉满

CloudSen

May 14

@maocat niubiest

CloudSen

May 14

@stormtrooperx5 那是啥原因导致的呢？刚开始才放出 qwen3.6 的时候，确实能解决不少复杂问题，现在简单的做着都费劲

shakaraka

May 14

kimi 都比 qwen 好不知多少倍就现在这个时间点

stormtrooperx5

May 14

@CloudSen 如果想验证可以直接走百炼按量付费的模型测一下

stormtrooperx5

May 14

比如 qwen3.6-plus-2026-04-02 这个是快照版本，如果两边确实效果不一样可以发工单喷他们

suman

May 14

比较好奇，同样的模型，是什么参数导致降智的？

MuyuQ

May 14

不要用 3.6plus 。目前是垃圾中的垃圾。无效循环，胡言乱语。
用他的 glm 和 kimi 还行。

MuyuQ

May 14

@stormtrooperx5 coding plan 目前接入的 3.6Plus 基本不可用。每天都会遇到胡言乱语或者首字奇慢。已经联系过客服，喷过了。

cnrting

May 14

降脂比中转还恶心，好歹中转一分钱一分货

soFollish

May 14

同意，之前的 coding plan 也是这样。
让调试个 bug ，不从代码入手，不去读日志，然后问你请求的哪个接口？发送的什么参数？
然后怀疑你是不是没重启，反正就是不干活。

billccn

May 14

@soFollish 哈哈以为花钱请帮手，结果花钱给自己加了个老板

BreaveHeart007

May 14

真有人买 tokenplain 啊买腾讯云的 coding-plain 不好吗

stormtrooperx5

May 15 via Android

@MuyuQ coding plan 和 token plan 不一样，coding plan 的确实会慢些，而且要限流，但我用起来没感觉有性能下降

wudicgi

May 15

Token Plan 现在不是有 glm-5.1 了吗

SgyyNero

May 15

阿里目前在他的下游供应商推 Qoder ，要求他们的外包上都使用。

CloudSen

May 15

@BreaveHeart007 公司买的，反正不花我的钱

CloudSen

May 15

@wudicgi 看见了，下午就测试

JerningChan

May 15

所以，还是自己本地部署个 qwen3.6-35b / 27b 用起来，写写小代码，写点 web 页面，感觉上还不错喔，我都是通过 hermes / cc 对接

之前试过 cc 对接 qwen3.6-plus ，叫他读完一个代码，用完一个优惠套餐的 20 元额度，就不想用了，这么简单的事情，用个 2080ti 22g ，也就 10 分钟的电费。。。

CloudSen

May 15

@MuyuQ glm5.1 测试了，也不行，一个都不能打

CloudSen

May 15

@wudicgi 已测试，一个都不能打

laoyutang

May 15

我要 glm5.1 感觉还好啊。就是一下午能用 50%，扛不住

CloudSen

May 15

@JerningChan 我得给我的 2080 焊焊内存

JerningChan

May 15

@CloudSen 哈哈哈，有 2080ti ，当然是魔改一下 22g 啊，我用来跑 qwen3.6-35b-a3b 很不错啊，我平常是 hermes 调用，需要改点严谨些的代码就换 cc 调用

zh7896

May 16

@maocat 强到离谱