[科普向]claude 中转站为什么这么费钱？明明便宜 70%，余额却消耗得飞快

This topic created in 48 days ago, the information mentioned may be changed or developed.

最近在 V2 和 LinuxDo 看到不少人吐槽：中转站价格明明便宜，但余额消耗速度比官方还快。

有人说"自己什么都没做，上下文就已经用了 25K"，有人说"扣费扣得有点快，但看日志每次请求又正常"。

今天算一笔账，看看钱到底花在哪了。

一、缓存率：被忽视的吃钱黑洞

什么是 Prompt Caching ？

大模型每次对话都要重新读一遍完整历史。就像翻译文件，每次都要从头读一遍之前的内容。

Prompt Caching 就是把读过的内容缓存起来，下次直接用。**缓存命中的部分，价格降低 90%**。

Prompt Caching 价格表：

操作类型	价格倍率	说明
正常输入	1x	基础价格
缓存创建（ 5 分钟）	1.25x	首次建立缓存
缓存创建（ 1 小时）	2x	长期缓存
缓存读取	0.1x	便宜 90%

缓存率对成本的影响

核心原理：缓存命中的部分，成本只有原来的 10%（节省 90%）。

举个例子：

假设你和 Claude 聊了很久，对话历史有 50K tokens 。

官方渠道（有缓存）：

第 1 次请求：50K tokens 全部计费，建立缓存
第 2 次请求：50K tokens 中 80% 从缓存读取（便宜 90%），只有 20% 重新计算
第 3 次、第 4 次...都是这样

中转站（无缓存）：

第 1 次请求：50K tokens 全部计费（虽然便宜 70%）
第 2 次请求：50K tokens 又全部计费
第 3 次、第 4 次...每次都全部计费

算一笔账（ 10 次对话）：

场景	首次成本	后续 9 次成本	总成本
官方（有缓存）	100	9 × 28 = 252	352
中转站（无缓存但便宜 70%）	30	9 × 30 = 270	300

看起来中转站便宜？但如果对话次数更多：

算一笔账（ 100 次对话）：

场景	首次成本	后续 99 次成本	总成本
官方（有缓存）	100	99 × 28 = 2772	2872
中转站（无缓存但便宜 70%）	30	99 × 30 = 2970	3000

结论：对话次数越多，官方越划算。

为什么中转站缓存率低？

原因一：逆向渠道本身不支持缓存

Kiro 、Cursor 、Windsurf 等客户端的逆向接口，本身就不支持 Prompt Caching 。中转站即使想提供也做不到。

原因二：号池轮询导致缓存失效

中转站用号池轮询分配请求：

第一次请求用账号 A ，缓存建在 A 上
第二次请求分配到账号 B ，缓存全部失效
第三次请求又分配到账号 C ，又要重新建缓存

结果就是：缓存创建多，但命中的少。

原因三：虚标缓存率

有些中转站声称有缓存，实际是站长写死的假数据（比如写死 80%~88%）。

实际情况：缓存率差 10%，长期成本可能更高。

二、隐藏的系统提示词：上下文黑洞

一个真实案例

有人测试发现：

用自己的 Claude Pro 账号，新对话 /context 显示正常
用中转站，新对话 /context 显示已经用了 25K

问客服，客服说"就是官网，不可能是假的"，然后就不解释了。

为什么会有隐藏的系统提示词？

原因一：反代客户端自带的提示词

逆向 Kiro 、Cursor 等客户端的接口，这些客户端有自己的系统提示词（专为代码场景优化）。你的请求会被自动注入这些提示词。你看不到，但它在消耗你的 tokens 。

原因二：中转站自己注入的提示词

有些中转站为了"优化"体验，会注入自己的提示词。这些提示词每次对话都要计算，而且无法缓存。

原因三：多层代理叠加

中转站 A 从中转站 B 拿货，中转站 B 又从中转站 C 拿货。每一层都可能注入自己的提示词。最终到你手上，上下文已经被塞满了。

如何验证？

方法：用 /context 命令对比

用官方账号新建对话，输入 /context，记录基础消耗
用中转站新建对话，输入 /context，记录基础消耗
对比两者差异

判断标准：

如果中转站的基础消耗明显高于官方（差距超过 50%），说明中转站注入了额外的系统提示词
这些额外的提示词每次对话都要计算，而且无法缓存

注意：即使是官方账号，新建对话后也会有系统提示和工具的基础消耗，不会是 0

三、切换服务商 + 无缓存 = 双重打击

为什么需要频繁切换？

中转站经常不可用，很多人需要准备多个备用中转站。甚至有人问"怎么快速切换，不用每次都复制 url 和 api-key"——切换频繁到需要专门的工具。

切换的成本

每次切换，缓存全部丢失

举个例子：

你在服务商 A 上聊了很久，已经建立了缓存。现在每次对话成本很低（假设 100 元）。

突然服务商 A 挂了，你切换到服务商 B：

服务商 B 没有你之前的缓存
需要重新建立缓存
首次请求成本：500 元（是有缓存时的 5 倍）

如果一天切换 3 次：

第 1 次切换：多花 400 元（ 500 - 100 ）
第 2 次切换：又多花 400 元
第 3 次切换：又多花 400 元
一天多花 1200 元

切换 + 无缓存 = 双重打击：

切换导致缓存丢失（每次切换都要重新建缓存）
中转站本身缓存率低（即使不切换，缓存命中率也低）
双重打击，成本爆炸

四、其他吃钱的坑

扣费 bug

有些中转站存在扣费 bug：

缓存创建和缓存读取计费混乱
重复计费
计费精度问题

套餐陷阱

便宜的套餐往往有日度预算限制，比如 11.90$ 的套餐每天只有 25$ 额度，根本不够用。超出部分按量计费，可能比官方还贵。

贵的套餐又用不完，不用就等于亏了。

不稳定导致的重试成本

有些低价分组很不稳定，不是 api timeout 就是 filter 。timeout 后重试，每次重试都要重新计费。不稳定导致的重试成本，可能比正常使用还高。

五、如何避免被坑

选择中转站的核心原则

原则一：问清楚缓存率

不支持缓存的中转站，再便宜也贵
虚标缓存率的中转站，更坑
要求提供真实的缓存命中数据

原则二：测试上下文消耗

新建对话，用 /context 检查
看上下文是否有隐藏的系统提示词
如果有，立即退款

原则三：算清楚长期成本

不要只看单价
要看缓存率
要看长期使用的总成本

官方 vs 中转站：全面对比

维度	官方渠道	中转站
月费	$20 （ Claude Pro ）	看起来便宜
缓存率	80%~85%	0%~40%
稳定性	高	差，需要频繁切换
长期成本	约 28%	40%~60%
隐藏提示词	无	可能有
扣费透明度	高	可能有 bug

结论：短期看中转站便宜，长期看官方更划算。

什么时候可以用中转站？

场景类型	是否适合	原因
短对话	✅ 适合	上下文少，缓存影响小
临时使用	✅ 适合	不需要长期稳定
预算极度有限	✅ 适合	愿意接受不稳定
长对话	❌ 不适合	上下文多，缓存影响大
重度使用	❌ 不适合	每天高频使用，成本累积
对稳定性有要求	❌ 不适合	不能接受频繁切换

总结

中转站价格便宜 70%，但缓存率低或没有缓存
缓存率差 10%，长期成本可能更高
隐藏的系统提示词，每次对话都在吃钱
频繁切换 + 无缓存 = 双重打击，成本爆炸

最后建议：问清楚缓存率、测试上下文消耗、算清楚长期成本。别让"便宜"蒙蔽了双眼，最后发现钱花得比官方还多。

数据来源：基于官方以及参考真实用户使用信息，仅供参考

缓存

中转站

成本

22 replies • 2026-04-07 11:05:30 +08:00

v2exgo

Mar 28

你这里没有计算，封号、找信用卡、找卡台，切换虚拟卡，重新注册等一堆的时间成本。实际上用中转站，把高度机密的令牌跟密码保护好，只提交屎山代码，基本上是国内最佳的选择了

你有时间折腾那些防封，搞信用卡什么的咱另说

HFX3389

Mar 28

`Kiro 、Cursor 、Windsurf 等客户端的逆向接口，本身就不支持 Prompt Caching 。中转站即使想提供也做不到。`

其实很早就能做到 Prompt Caching 了...现在的中转站缓存率就算是逆向的也能做到跟官方一样的缓存率了，你这 40%缓存率的知识库已经 out 了

`号池轮询导致缓存失效`

其实很早就能做到粘性会话了...最多就是本来访问账号 A 的但是账号 A 用满了切到账号 B 所以要重建一次缓存

`隐藏提示词`和`扣费透明度`倒是真的存在，还有各种倍率乱标的。

用中转站还是得找主动把渠道和有无缓存标出来中转站，不标的站还是让它自生自灭吧

重度使用能开官方的还是开官方的套餐最好，不仅体验一流，用多一些额度算下会比充中转站更划算

scf2024

Mar 28

@HFX3389 主要是现在中转站良莠不齐，各种坑人，还是希望这些站点能透明一些，因为相对官方的封号风险，中转站确实相对便捷

miniliuke

Mar 28

@scf2024 现在中转站感觉以后就像现在的机场一样，一定会有人脱颖而出的，而且这个生意在国内算擦边都不违法

NO9527

Mar 28

都是中转站了，干出什么垃圾事都符合想象

lekai63

Mar 28

官方 claude code 缓存免费。

中转站 0.1x

你一次请求里，可能 70%-80%的内容都是 cache 。

中转站吃这 0.1x 也不差

scf2024

Mar 28

@v2exgo 你说得对。写这篇是因为我自己之前也用过中转站，但是发现余额消耗特别快，研究后发现是缓存率的问题。主要是是提醒大家如果一定要选中转站要看下缓存率。

HFX3389

Mar 28

@miniliuke #4 还是有那么一些的，毕竟有这么条：

第二十一条提供者违反本办法规定的，由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚；法律、行政法规没有规定的，由有关主管部门依据职责予以警告、通报批评，责令限期改正；拒不改正或者情节严重的，责令暂停提供相关服务。

构成违反治安管理行为的，依法给予治安管理处罚；构成犯罪的，依法追究刑事责任。

HFX3389

Mar 28

@scf2024 #7 只是缓存率吗，不是中转站给你调了倍率你没发现吧？正常 opus ，分组倍率为 1 时，input/output 价格应该是$5/$25 哦，去使用记录看看你的倍率是不是正常的吧，相信你或许会有新的发现

TsubasaHanekaw

Mar 28

想不折腾用 claude ，那国内最好的就是直接自己逆向 github copilot 的订阅。

foufoufm

Mar 28

我自己也测试是使用了中转，结论确实不如官方，又慢效果又差，还很贵。一个问题十几刀就没了

scf2024

Mar 28 via Android

@HFX3389 已经弃用了，可能还动了其他手脚

shenguna

Mar 28

自己部署和本地模型，qwen3 coder 80ba3b ，8bit ，80G 模型，用一台 macbook 128g 内存可以跑，每秒 45tokens ，虽然弱智，但无限量烧 tokens

gotoschool

Mar 28

实际上就比如咱留言中开中转站的，自己对接个上游就说自己是中转站一手资源纯粹的。

Admstor

Mar 28

@miniliuke 数据出境怎么可能不违法。。。机场不管怎样最多也就是慢一点，你该看到啥样的还是啥样的，AI 中转站完全全链路黑箱

love2328

Mar 28

中转还是自己搭个好,预防换脑

Jtyczc

Mar 29

还是自己搭中转站加一

zed1018

Mar 29

啊？没有人用过流量卡吗？一个道理的啊。

857681664

Mar 29

是这样的，用过一个号称最便宜的中转，一个月在非常省的用法下，还是花了将近 20 刀，于是不嫌麻烦开通了 chatgptplus 和 claude pro ，开通后用上才发觉，还是官方香啊，用起来毫无心理负担，2 个交叉用 5 小时根本用不完额度，即使用完了，大不了自己动手写一会额度就恢复了。

cuiziwei1992

Mar 30

楼主说的坑确实存在，不过走官方 API 直连的中转站是支持 prompt caching 的，缓存命中率跟官方差不多。我用的 aihub-global.com 是直接对接 Anthropic 官方 API ，不注入额外 system prompt ，/context 查出来跟官方账号基本一致，用了挺久了没遇到余额异常消耗的问题。选中转站主要还是看它走哪条渠道。

kkkbbb

Apr 5 via Android

@HFX3389 你的意思是 kiro,cursor 不会带 cache_control 标记？

ddshub

Apr 7

选 max 号池的中转站或者 sub2api 的基本上就都有缓存
反正小额测试不亏的，我现在用 ddshub 点 cc 这家。只能 Claude 调用，还可以