小米真的是营销大师， mimo 降价了又好像没降多少

先上结论：

确实降价了，但是无缓存还是贵
Credits 提升了 5-8 倍，但倍率也提升了很多（ Credits:Tokens ）

看别的论坛说命中率与 Deepseek 差不多（网上的内容，我没有实测）

理性来看，这次更新算正向的

说实话咋一看还以为是先涨价后降价本来想发帖喷，后面仔细研究才发现其实也还好... 估计是鼓励更多的命中缓存

https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-price-update

降价

更新

缓存

11 replies • 2026-05-27 22:25:49 +08:00

tf2

May 27

你才是标题党营销大师

beyond98

May 27 via iPhone

@tf2 楼主说的也没错吧，小米本来就没降多少，量多了消耗也变大了，哪有宣传力里说的增加了多少倍的用量

ifwant

May 27 via Android

看 api 调用价格已经和 deepseek 一样了，还是降挺多的了。印证了那句话，不超过 deepseek 的价格还比 deepseek 高的在 ai 时代必死（说的就是你 minimax ）

sillydaddy

May 27

一般用 claude code 这类 agent ，缓存会占比很大，一般都会在 90%以上。因为它要经历 thinking..action..thinking..action 这样很多轮，轮次越多，缓存占比越大，因为每一轮都会把之前轮的那些输入喂给大模型，这些就是缓存。

假如每轮新输入 10000 个 token ，那么 10 轮后，未缓存的就是 100000 个 token ，缓存的呢？ 10000+20000+30000+...+100000=5550000 ，缓存命中率=5550000/5650000=98%

实际要考虑上下文超出会压缩，导致原来的缓存失效。但缓存命中率只跟 Agent 工具的用法有关系，Agent 模式一般都能到 90%以上，除非你特意优化 Agent 的流程，减少缓存的占用，比如使用定制的流程去处理，例如那些 AI 视频生成管线，把流程前一环节的输出经过筛选，作为下一环节 API 调用的输入，而不是堆积信息，这样会减少缓存。

这是我用 claude code 调用小米 token plan 处理文本提取信息，这个场景下的消耗（缓存占比非常大，命中率 97%，这种情况下，可用量确实提高了 10 倍左右）：
https://v2ex.com/t/1215750#r_17686925

不过，小米套路多倒是真的。

sillydaddy

May 27

@sillydaddy #4 上面的例子算错了😓，10 轮命中率=550000/650000=85%。