昨天 QWEN 今天 KIMI 都发布了新基座模型,测了几个前端用例 KIMI 还略好于 gemini3 pro 和 claude4.5 sonet ,有点惊喜。Qwen 看 benchmark 很厉害,实际用有点已读乱回的意思...
1
jaleo Jan 27 千问已经有了 qwen 里还没更新
|
2
Meteora626 Jan 27
qwen 测试的是工具集群吧,官网的单模型差点意思,
|
3
RandyLuo Jan 27 via Android
Kimi2.5thinking 很行,qwen 不太行
|
4
chunhuitrue Jan 27
@RandyLuo 怎么对比的,详细说说?
|
5
germain Jan 27
Qwen3 太贵了,昨天用这个新 Model 小刷了一下一个简单的前端 UI ,刷掉我 200 人民币,还没刷好,我惊了。也不知道是不是 Token 计费结算有什么问题。
|
7
RandyLuo Jan 27
@chunhuitrue https://livebench.ai/ 这个网站的最新测试集没法刷,23 年就有的榜,基本和体感一致。我有个很长链路的音响系统的问题,opus 、gemini3pro 都没解决,qwen 更不用说了,就 gpt5.2 一次就回答对,kimi k2.5thinking 只有很小的地方偏了点,一次提示后就纠正解决问题了。
|
9
Sezxy Jan 28 via Android
kimi k2.5+opencode,感觉很不错,我今天几个需求都用它俩解决
|
10
zhonghao01 Jan 28
昨天对比了下 Qwen3-Max-Thinking 和 GLM 4.7 ,相同的提示词,做出来的效果都不如 GLM ,qwen 做出来的网页很粗糙,效果也不是想要的效果,GLM 做的要好看,基本符合要求。
|
11
letitbesqzr Jan 28
@Sezxy #9
请问是如何配置 让 kimi k2.5 搭配 opencode 的? 我这边配置后 直接提示: Kimi For Coding is currently only available for Coding Agents such as Kimi CLI, Claude Code, Roo Code, Kilo Code, etc. |
12
Sezxy Jan 28
@letitbesqzr #11 我没有买它的 coding 套餐,之前刚出来的时候送的 50 元我还没用完
|
14
zuosiruan Jan 28

kimi 网站挂了 |
16
chunhuitrue Jan 28
@RandyLuo 赞,看来靠谱。
|