好处就不说了,吐槽的肯定是令人印象的失败
1 一顿操作猛如虎 token 用掉 250 一看效果 250 例如 kimi code 2.7 glm 5.2 你提个问题,它的深度思考就刷刷刷的拼命刷 token 。然后要么改出来的还是原错误,要么直接摆烂甩锅。
2 抽风的 ds 让它按协议分析一段日志,回头一看,它不在线搜索协议,把整个代码库翻一遍,token++
3 摆烂的 ds 让它改代码按规范生成数据,它直接把验证部分改了,多加一个返回值判断。。。
4 无限尝试 例如它想找代码,这里找不到,会再上一级,再上一级,,,
5 本地为尊 经常回答着回答着又从规范绕回代码,因为代码这么写的,所以输出没问题
6 无限思考 不停的同样分析内容刷屏,感觉像撑爆了又从头吃一次,问题是有时候甚至就是个单文件。。。
7 扩展修改 给段错误分析,明明修完第一个就可以覆盖后面几个,会无中生有的继续改一通。。。