计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。
不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。
目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。
计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。
不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。
目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。
1
imlonghao 9h 29m ago
别单算输入输出比,缓存率也得考虑啊
|
2
soulflysimple123 8h 54m ago
opencode go
|
3
Censhuang 8h 52m ago
给个方向:租算力去自己推理?
|
4
rotor1996 8h 8m ago via iPhone
中转站啊
|
5
qili36585009 8h 5m ago
推荐你用中转站的 gpt5.4 相对来说还是很便宜的
|
6
wuxkwnjjwoxk 7h 54m ago via iPhone
收雷总送的 mimo 额度呀,我 max plan 还有 900 亿 credit ,可出
|
7
rubi 7h 50m ago
来用中转站吧
|
8
afkool 7h 46m ago
中转呗。。当然自己买 Pro20 最划算。
|
9
huahuaccc 7h 35m ago
500 亿 token ,中转也便宜不到几千块啊
|
10
LeeReamond OP |
11
noqwerty 5h 50m ago
试一下这个缓存率也很低吗 https://github.com/esengine/deepseek-reasonix
|
12
sakurajiayou PRO 看看我之前发的几个贴子,肯定能解决你的问题
|
13
106npo 2h 24m ago via Android
缓存率这么低的话,minimax 吧,预计 3000 多,但你得用一个月跑
|
14
409164 5 mins ago via iPhone
mbp 本地模型考虑一下?
|