V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  blueskeay  ›  全部回复第 3 页 / 共 7 页
回复总数  122
1  2  3  4  5  6  7  
18 天前
回复了 wnzhyee 创建的主题 程序员 原来中转站缓存失效的话是自认倒霉的吗
@HFX3389 ....A\模型不同渠道的温度不一样,昨天 max 订阅确实很难用,反正我自己测下来让两种渠道的做一样的任务的结果是这样
倍率肯定不可能,也没说这个能做到那么便宜呀...
19 天前
回复了 wnzhyee 创建的主题 程序员 原来中转站缓存失效的话是自认倒霉的吗
就 10 块 10 块冲就行了..
我自己做中转站都不开什么订阅套餐,推荐让客户按需充值

缓存这个问题看调度吧,缓存基本都是从服务商那边拉的,特别接了多个上游负载均衡的中转,切上游了缓存就 G 了

可以考虑用 codex ( codex 我家的稳定性和缓存绝对在线 https://v2ex.com/t/1203644
晚上又上了一个新版本进一步优化了客户端不支持缓存的情况,有可用性可以看,多个下游的明智之选

明天或者后天会上一个自持的 claude 新渠道,实际体验下来我比我自己 max 订阅还好用就很离谱...
新上了缓存优化 api ,之前有缓存问题的可以测试一下
晚点会部署一个更新,针对部分客户端缓存的问题应该会有优化
@duyu 已加
@happysiva 已加
@svendson
@lich13
已加
刚才部署了个更新失败回滚了,可能导致有~2m 左右的体感不可用....
认错挨打
@somehand 加了,可以试用一下
@abbycin 懂了,现在还有出现吗,看了下服务器负载没问题,用的是哪个 endpoint ,频繁出现的话可以联系客服看看咋回事
@miniers
已加
@blueskeay 已加,可以试用一下
@abbycin 啊?这个是啥… 没发现问题呀
@464084838 破案了,又一个缓存刺客,我终于知道我后台那一堆报错哪来的了.... 你看那缓存像过山车一样没觉得不对劲吗



客户端不要传 service_tier 这个参数,透传到 openai 那边会报错然后反复重试报错导致不断切号,你看一下你请求的缓存完全不对劲

"detail": "Unsupported service_tier: auto"

https://i.imgur.com/qKP7Pdz.png

https://i.imgur.com/llLgQj7.png

给你补了 5 块余额... 这个还不是 header 里的我没法在 nginx 上控制,你看一下本地什么设置导致的...
@ctro15547 晚两天加上... 现在模型少,聪明点的其实就 GPT-5.4 和 GPT-5.3-codex 这两种
@Rokaki 感觉不是很对,是 codex 客户端吗,我看了一圈还是 codex 客户端利用缓存是最好的...
@taotaodaddy 差不多符合预期,上下文再长一点缓存受益能拉到 0.8 左右/M
@noming 是 CF 的吗,我自己试了下 CF 是没问题的
@cdwyd 加了
1  2  3  4  5  6  7  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   992 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 20:13 · PVG 04:13 · LAX 13:13 · JFK 16:13
♥ Do have faith in what you're doing.