V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
subpo

有没有专注于便宜/速度快的在线模型推荐?类似 gemini-3.1-flash-lite 的

  •  
  •   subpo · 6 天前 · 439 次点击
    用途是用于本地的轻度需求,比如语音输入做后处理,或者翻译等等

    我本来 gemini-3.1-flash-lite-preview 用得特别好,速度贼快而且 pro 套餐每个月送 10 刀 api 额度压根用不完

    但是现在 G 家明显算力奇缺,这种模型经常 429 ,速度也不快了,语音输入动不动报错真是服了

    现在还有推荐的吗?不考虑本地模型,我的 mac 跑 e4b 虽然也能满足需求,但是处理一个请求 3 ,4 秒钟,还是太慢了

    haiku 5.4-mini 这类太贵的也不想用,毕竟原本是相当于免费的

    还有选择吗?
    3 条回复    2026-04-16 14:07:10 +08:00
    xixi1412
        1
    xixi1412  
       6 天前
    openrouter,账号里充 10 刀,免费模型每天可调 1000 次
    subpo
        2
    subpo  
    OP
       6 天前
    @xixi1412 免费模型速度都不大行
    xixi1412
        3
    xixi1412  
       6 天前
    @subpo 没遇到过速度问题,前几天 qwen3.6plus free,一天一亿很流畅.一个账号不够,就多几个账号负载均衡一下.
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1240 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:41 · PVG 01:41 · LAX 10:41 · JFK 13:41
    ♥ Do have faith in what you're doing.