V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
scf2024
V2EX  ›  Claude

[科普向]claude 中转站为什么这么费钱?明明便宜 70%,余额却消耗得飞快

  •  2
     
  •   scf2024 · 11 小时 14 分钟前 · 1371 次点击

    最近在 V2 和 LinuxDo 看到不少人吐槽:中转站价格明明便宜,但余额消耗速度比官方还快。

    有人说"自己什么都没做,上下文就已经用了 25K",有人说"扣费扣得有点快,但看日志每次请求又正常"。

    今天算一笔账,看看钱到底花在哪了。


    一、缓存率:被忽视的吃钱黑洞

    什么是 Prompt Caching ?

    大模型每次对话都要重新读一遍完整历史。就像翻译文件,每次都要从头读一遍之前的内容。

    Prompt Caching 就是把读过的内容缓存起来,下次直接用。**缓存命中的部分,价格降低 90%**。

    Prompt Caching 价格表

    操作类型 价格倍率 说明
    正常输入 1x 基础价格
    缓存创建( 5 分钟) 1.25x 首次建立缓存
    缓存创建( 1 小时) 2x 长期缓存
    缓存读取 0.1x 便宜 90%

    缓存率对成本的影响

    核心原理:缓存命中的部分,成本只有原来的 10%(节省 90%)。

    举个例子

    假设你和 Claude 聊了很久,对话历史有 50K tokens 。

    官方渠道(有缓存)

    • 第 1 次请求:50K tokens 全部计费,建立缓存
    • 第 2 次请求:50K tokens 中 80% 从缓存读取(便宜 90%),只有 20% 重新计算
    • 第 3 次、第 4 次...都是这样

    中转站(无缓存)

    • 第 1 次请求:50K tokens 全部计费(虽然便宜 70%)
    • 第 2 次请求:50K tokens 又全部计费
    • 第 3 次、第 4 次...每次都全部计费

    算一笔账( 10 次对话):

    场景 首次成本 后续 9 次成本 总成本
    官方(有缓存) 100 9 × 28 = 252 352
    中转站(无缓存但便宜 70%) 30 9 × 30 = 270 300

    看起来中转站便宜?但如果对话次数更多:

    算一笔账( 100 次对话):

    场景 首次成本 后续 99 次成本 总成本
    官方(有缓存) 100 99 × 28 = 2772 2872
    中转站(无缓存但便宜 70%) 30 99 × 30 = 2970 3000

    结论:对话次数越多,官方越划算。

    为什么中转站缓存率低?

    原因一:逆向渠道本身不支持缓存

    Kiro 、Cursor 、Windsurf 等客户端的逆向接口,本身就不支持 Prompt Caching 。中转站即使想提供也做不到。

    原因二:号池轮询导致缓存失效

    中转站用号池轮询分配请求:

    • 第一次请求用账号 A ,缓存建在 A 上
    • 第二次请求分配到账号 B ,缓存全部失效
    • 第三次请求又分配到账号 C ,又要重新建缓存

    结果就是:缓存创建多,但命中的少。

    原因三:虚标缓存率

    有些中转站声称有缓存,实际是站长写死的假数据(比如写死 80%~88%)。

    实际情况:缓存率差 10%,长期成本可能更高。


    二、隐藏的系统提示词:上下文黑洞

    一个真实案例

    有人测试发现:

    • 用自己的 Claude Pro 账号,新对话 /context 显示正常
    • 用中转站,新对话 /context 显示已经用了 25K

    问客服,客服说"就是官网,不可能是假的",然后就不解释了。

    为什么会有隐藏的系统提示词?

    原因一:反代客户端自带的提示词

    逆向 Kiro 、Cursor 等客户端的接口,这些客户端有自己的系统提示词(专为代码场景优化)。你的请求会被自动注入这些提示词。你看不到,但它在消耗你的 tokens 。

    原因二:中转站自己注入的提示词

    有些中转站为了"优化"体验,会注入自己的提示词。这些提示词每次对话都要计算,而且无法缓存。

    原因三:多层代理叠加

    中转站 A 从中转站 B 拿货,中转站 B 又从中转站 C 拿货。每一层都可能注入自己的提示词。最终到你手上,上下文已经被塞满了。

    如何验证?

    方法:用 /context 命令对比

    1. 用官方账号新建对话,输入 /context,记录基础消耗
    2. 用中转站新建对话,输入 /context,记录基础消耗
    3. 对比两者差异

    判断标准

    • 如果中转站的基础消耗明显高于官方(差距超过 50%),说明中转站注入了额外的系统提示词
    • 这些额外的提示词每次对话都要计算,而且无法缓存

    注意:即使是官方账号,新建对话后也会有系统提示和工具的基础消耗,不会是 0


    三、切换服务商 + 无缓存 = 双重打击

    为什么需要频繁切换?

    中转站经常不可用,很多人需要准备多个备用中转站。甚至有人问"怎么快速切换,不用每次都复制 url 和 api-key"——切换频繁到需要专门的工具。

    切换的成本

    每次切换,缓存全部丢失

    举个例子:

    你在服务商 A 上聊了很久,已经建立了缓存。现在每次对话成本很低(假设 100 元)。

    突然服务商 A 挂了,你切换到服务商 B:

    • 服务商 B 没有你之前的缓存
    • 需要重新建立缓存
    • 首次请求成本:500 元(是有缓存时的 5 倍)

    如果一天切换 3 次:

    • 第 1 次切换:多花 400 元( 500 - 100 )
    • 第 2 次切换:又多花 400 元
    • 第 3 次切换:又多花 400 元
    • 一天多花 1200 元

    切换 + 无缓存 = 双重打击

    • 切换导致缓存丢失(每次切换都要重新建缓存)
    • 中转站本身缓存率低(即使不切换,缓存命中率也低)
    • 双重打击,成本爆炸

    四、其他吃钱的坑

    扣费 bug

    有些中转站存在扣费 bug:

    • 缓存创建和缓存读取计费混乱
    • 重复计费
    • 计费精度问题

    套餐陷阱

    便宜的套餐往往有日度预算限制,比如 11.90$ 的套餐每天只有 25$ 额度,根本不够用。超出部分按量计费,可能比官方还贵。

    贵的套餐又用不完,不用就等于亏了。

    不稳定导致的重试成本

    有些低价分组很不稳定,不是 api timeout 就是 filter 。timeout 后重试,每次重试都要重新计费。不稳定导致的重试成本,可能比正常使用还高。


    五、如何避免被坑

    选择中转站的核心原则

    原则一:问清楚缓存率

    • 不支持缓存的中转站,再便宜也贵
    • 虚标缓存率的中转站,更坑
    • 要求提供真实的缓存命中数据

    原则二:测试上下文消耗

    • 新建对话,用 /context 检查
    • 看上下文是否有隐藏的系统提示词
    • 如果有,立即退款

    原则三:算清楚长期成本

    • 不要只看单价
    • 要看缓存率
    • 要看长期使用的总成本

    官方 vs 中转站:全面对比

    维度 官方渠道 中转站
    月费 $20 ( Claude Pro ) 看起来便宜
    缓存率 80%~85% 0%~40%
    稳定性 差,需要频繁切换
    长期成本 约 28% 40%~60%
    隐藏提示词 可能有
    扣费透明度 可能有 bug

    结论:短期看中转站便宜,长期看官方更划算。

    什么时候可以用中转站?

    场景类型 是否适合 原因
    短对话 ✅ 适合 上下文少,缓存影响小
    临时使用 ✅ 适合 不需要长期稳定
    预算极度有限 ✅ 适合 愿意接受不稳定
    长对话 ❌ 不适合 上下文多,缓存影响大
    重度使用 ❌ 不适合 每天高频使用,成本累积
    对稳定性有要求 ❌ 不适合 不能接受频繁切换

    总结

    1. 中转站价格便宜 70%,但缓存率低或没有缓存
    2. 缓存率差 10%,长期成本可能更高
    3. 隐藏的系统提示词,每次对话都在吃钱
    4. 频繁切换 + 无缓存 = 双重打击,成本爆炸

    最后建议:问清楚缓存率、测试上下文消耗、算清楚长期成本。别让"便宜"蒙蔽了双眼,最后发现钱花得比官方还多。


    数据来源:基于官方以及参考真实用户使用信息,仅供参考

    16 条回复    2026-03-28 23:51:40 +08:00
    v2exgo
        1
    v2exgo  
       11 小时 10 分钟前
    你这里没有计算,封号、找信用卡、找卡台,切换虚拟卡,重新注册等一堆的时间成本。实际上用中转站,把高度机密的令牌跟密码保护好,只提交屎山代码,基本上是国内最佳的选择了

    你有时间折腾那些防封,搞信用卡什么的 咱另说
    HFX3389
        2
    HFX3389  
       10 小时 56 分钟前   ❤️ 1
    `Kiro 、Cursor 、Windsurf 等客户端的逆向接口,本身就不支持 Prompt Caching 。中转站即使想提供也做不到。`

    其实很早就能做到 Prompt Caching 了...现在的中转站缓存率就算是逆向的也能做到跟官方一样的缓存率了,你这 40%缓存率的知识库已经 out 了

    `号池轮询导致缓存失效`

    其实很早就能做到粘性会话了...最多就是本来访问账号 A 的但是账号 A 用满了切到账号 B 所以要重建一次缓存

    `隐藏提示词`和`扣费透明度`倒是真的存在,还有各种倍率乱标的。

    用中转站还是得找主动把渠道和有无缓存标出来中转站,不标的站还是让它自生自灭吧

    重度使用能开官方的还是开官方的套餐最好,不仅体验一流,用多一些额度算下会比充中转站更划算
    scf2024
        3
    scf2024  
    OP
       10 小时 52 分钟前
    @HFX3389 主要是现在中转站良莠不齐,各种坑人,还是希望这些站点能透明一些,因为相对官方的封号风险,中转站确实相对便捷
    miniliuke
        4
    miniliuke  
       10 小时 46 分钟前
    @scf2024 现在中转站感觉以后就像现在的机场一样,一定会有人脱颖而出的,而且这个生意在国内算擦边都不违法
    NO9527
        5
    NO9527  
       10 小时 46 分钟前   ❤️ 1
    都是中转站了,干出什么垃圾事都符合想象
    lekai63
        6
    lekai63  
       10 小时 46 分钟前
    官方 claude code 缓存免费。

    中转站 0.1x

    你一次请求里,可能 70%-80%的内容都是 cache 。

    中转站吃这 0.1x 也不差
    scf2024
        7
    scf2024  
    OP
       10 小时 42 分钟前
    @v2exgo 你说得对。写这篇是因为我自己之前也用过中转站,但是发现余额消耗特别快,研究后发现是缓存率的问题。主要是是提醒大家如果一定要选中转站要看下缓存率。
    HFX3389
        8
    HFX3389  
       10 小时 30 分钟前
    @miniliuke #4 还是有那么一些的,毕竟有这么条:

    第二十一条 提供者违反本办法规定的,由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚;法律、行政法规没有规定的,由有关主管部门依据职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。

    构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。
    HFX3389
        9
    HFX3389  
       10 小时 24 分钟前
    @scf2024 #7 只是缓存率吗,不是中转站给你调了倍率你没发现吧?正常 opus ,分组倍率为 1 时,input/output 价格应该是$5/$25 哦,去使用记录看看你的倍率是不是正常的吧,相信你或许会有新的发现
    TsubasaHanekaw
        10
    TsubasaHanekaw  
       9 小时 18 分钟前
    想不折腾用 claude , 那国内最好的就是直接自己逆向 github copilot 的订阅 。
    foufoufm
        11
    foufoufm  
       9 小时 14 分钟前   ❤️ 1
    我自己也测试是使用了中转,结论确实不如官方, 又慢效果又差,还很贵。一个问题十几刀就没了
    scf2024
        12
    scf2024  
    OP
       8 小时 56 分钟前 via Android
    @HFX3389 已经弃用了,可能还动了其他手脚
    shenguna
        13
    shenguna  
       5 小时 50 分钟前
    自己部署和本地模型,qwen3 coder 80ba3b ,8bit ,80G 模型,用一台 macbook 128g 内存可以跑,每秒 45tokens ,虽然弱智,但无限量烧 tokens
    gotoschool
        14
    gotoschool  
       5 小时 46 分钟前
    实际上 就比如咱留言中开中转站的,自己对接个上游 就说自己是中转站一手资源 纯粹的。
    Admstor
        15
    Admstor  
       4 小时 58 分钟前
    @miniliuke 数据出境怎么可能不违法。。。机场不管怎样最多也就是慢一点,你该看到啥样的还是啥样的,AI 中转站完全全链路黑箱
    love2328
        16
    love2328  
       4 小时 3 分钟前
    中转还是自己搭个好,预防换脑
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   917 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 19:55 · PVG 03:55 · LAX 12:55 · JFK 15:55
    ♥ Do have faith in what you're doing.