LeeReamond
V2EX  ›  问与答

需要大概 500 亿 token,现在用什么方案比较好?

  •  
  •   LeeReamond · 9h 37m ago · 1111 views

    计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。

    不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。

    目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。

    14 replies    2026-06-08 05:13:53 +08:00
    imlonghao
        1
    imlonghao  
       9h 29m ago
    别单算输入输出比,缓存率也得考虑啊
    soulflysimple123
        2
    soulflysimple123  
       8h 54m ago
    opencode go
    Censhuang
        3
    Censhuang  
       8h 52m ago
    给个方向:租算力去自己推理?
    rotor1996
        4
    rotor1996  
       8h 8m ago via iPhone
    中转站啊
    qili36585009
        5
    qili36585009  
       8h 5m ago
    推荐你用中转站的 gpt5.4 相对来说还是很便宜的
    wuxkwnjjwoxk
        6
    wuxkwnjjwoxk  
       7h 54m ago via iPhone
    收雷总送的 mimo 额度呀,我 max plan 还有 900 亿 credit ,可出
    rubi
        7
    rubi  
       7h 50m ago
    来用中转站吧
    afkool
        8
    afkool  
       7h 46m ago
    中转呗。。当然自己买 Pro20 最划算。
    huahuaccc
        9
    huahuaccc  
       7h 35m ago
    500 亿 token ,中转也便宜不到几千块啊
    LeeReamond
        10
    LeeReamond  
    OP
       6h 11m ago
    @imlonghao 缓存率很低,如果高的话就用 deepseek 了,缓存率看了一下 10%左右。


    @rotor1996
    @rubi
    @afkool 中转靠谱么,中转也要走官方,它的利润点在哪里,感觉都是以次充好
    noqwerty
        11
    noqwerty  
       5h 50m ago
    试一下这个缓存率也很低吗 https://github.com/esengine/deepseek-reasonix
    sakurajiayou
        12
    sakurajiayou  
    PRO
       5h 46m ago
    看看我之前发的几个贴子,肯定能解决你的问题
    106npo
        13
    106npo  
       2h 24m ago via Android
    缓存率这么低的话,minimax 吧,预计 3000 多,但你得用一个月跑
    409164
        14
    409164  
       5 mins ago via iPhone
    mbp 本地模型考虑一下?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   825 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 79ms · UTC 21:19 · PVG 05:19 · LAX 14:19 · JFK 17:19
    ♥ Do have faith in what you're doing.