先上结论:
- 确实降价了,但是无缓存还是贵
- Credits 提升了 5-8 倍,但倍率也提升了很多( Credits:Tokens )
看别的论坛说命中率与 Deepseek 差不多(网上的内容,我没有实测)
理性来看,这次更新算正向的
说实话咋一看还以为是先涨价后降价 本来想发帖喷,后面仔细研究才发现其实也还好... 估计是鼓励更多的命中缓存
https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-price-update
先上结论:
看别的论坛说命中率与 Deepseek 差不多(网上的内容,我没有实测)
理性来看,这次更新算正向的
说实话咋一看还以为是先涨价后降价 本来想发帖喷,后面仔细研究才发现其实也还好... 估计是鼓励更多的命中缓存
https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-price-update
1
tf2 2 days ago 你才是标题党营销大师
|
3
ifwant 2 days ago via Android
看 api 调用价格已经和 deepseek 一样了,还是降挺多的了。印证了那句话,不超过 deepseek 的价格还比 deepseek 高的在 ai 时代必死(说的就是你 minimax )
|
4
sillydaddy 2 days ago
一般用 claude code 这类 agent ,缓存会占比很大,一般都会在 90%以上。因为它要经历 thinking..action..thinking..action 这样很多轮,轮次越多,缓存占比越大,因为每一轮都会把之前轮的那些输入喂给大模型,这些就是缓存。
假如每轮新输入 10000 个 token ,那么 10 轮后,未缓存的就是 100000 个 token ,缓存的呢? 10000+20000+30000+...+100000=5550000 ,缓存命中率=5550000/5650000=98% 实际要考虑上下文超出会压缩,导致原来的缓存失效。但缓存命中率只跟 Agent 工具的用法有关系,Agent 模式一般都能到 90%以上,除非你特意优化 Agent 的流程,减少缓存的占用,比如使用定制的流程去处理,例如那些 AI 视频生成管线,把流程前一环节的输出经过筛选,作为下一环节 API 调用的输入,而不是堆积信息,这样会减少缓存。 这是我用 claude code 调用小米 token plan 处理文本提取信息,这个场景下的消耗(缓存占比非常大,命中率 97%,这种情况下,可用量确实提高了 10 倍左右): https://v2ex.com/t/1215750#r_17686925 不过,小米套路多倒是真的。 |
5
sillydaddy 2 days ago
@sillydaddy #4 上面的例子算错了😓,10 轮命中率=550000/650000=85%。
|
6
liaohongxing 2 days ago
|
7
myarsenal 2 days ago
这算怎么个营销法
|
9
106npo 2 days ago via Android
@ifwant minimax 的标价就没准备去卖 甚至他的标价页都是错的,这么久了也没人管。2.7hs 的缓存写入价格写的比输入还便宜 🤣
|
10
CuteGirl 2 days ago
上个月送了一个月 这个月 1 分钱续费一个月 我感觉已经很良心了
|