不至于达到 CC 或者 codex 的水平,就是能作为生产力用。
现在有吗?
现在有吗?
1
testsb 8h 4m ago 综合排名: https://arena.ai/leaderboard/text/overall
专家排名(任务规划): https://arena.ai/leaderboard/text/expert 编码排名: https://arena.ai/leaderboard/text/coding qwen3.7-max-preview 、glm-5.1 、mimo-v2.5-pro 、kimi-k2.6 都还不错 |
3
est 7h 47m ago
mimo 2.5 pro 我觉得还行。
|
6
cs10086 7h 36m ago
deepseek 可以吧
|
7
NewYear 7h 36m ago
写代码可以的
就怕不定期降智,bug 数量突然爆发 |
8
testsb 7h 34m ago
|
9
testsb 7h 28m ago
OpenCode GO 基本几大 TOP 国模都能用,新用户首月半价 5 刀 ZFB 能付,可以自己实际都体验一下
|
10
zisen 7h 23m ago
glm5.1 上下文超过 150k 在 opencode 里面就会开始胡言乱语,表现为一直重复一句话,乱码,思考内容跑到回答里面,循环思考等等,100k 以内上下文还算稳定
deepseek 智商不稳定一会聪明一会能把你气个半死,而且很喜欢直接帮你改代码或者操作设备,只是问个问题就开始改代码 gpt5.4 是最通人性的基本上意图都能判断对 minimax 纯搞笑的用不得 其他的没咋用过 |
11
shakaraka PRO kimi2.6 目前已经很可以了,699 可以用好几天
|
17
testsb 6h 53m ago @wilddog 国模做 Plan 差点,最好用 cc/codex 做规划,然后让国模执行。GLM 总体不错不过就像 10 楼的兄弟说的那样上下文太小了做不了太复杂、占更多 context 的任务。
国内外主流模型混用和相互的替代性,可以参考 omo 对各模型特点的描述和角色的划分: https://github.com/code-yeongyu/oh-my-openagent/blob/dev/docs/guide/agent-model-matching.md 不过 omo 不是所有国模都涉及到了,而且有些也不是最新版本,应该是因为要做严格的适配性测试所以纳入的比较慢 |
18
dingawm 6h 48m ago
经典小马过河的问题,每个人的感受可能都不太一样,反正现在应该是基本离 Opus 4.6/GPT 5.4 还差点的水平
不行充点钱试试 DeepSeek ,反正按量付费,要是感觉完全接受不了,那其他的国产模型也不用试了 |
21
wilddog OP |
22
wangtufly 4h 25m ago via Android
梁圣在大 A 割你韭菜,在模型上补贴回来。这不赶紧蹬,捞回本
|