V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
meetyuan
V2EX  ›  程序员

AI 太烧钱了,有什么好的大模型组合方案?

  •  
  •   meetyuan · 7 小时 56 分钟前 · 4823 次点击

    用 AI 生成计划,写代码,用 claude-opus-4-6 半天烧了四十多,这样下去扛不住。

    我就想能不能使用 claude 或者 gpt 写计划,指定好详细的开发计划和实施流程,然后让 minimax(我买了一个月的 plus ,放那里快到期了)来完成实施过程以及测试?

    各位高手有什么建议没有?

    80 条回复    2026-04-21 18:05:11 +08:00
    YanSeven
        1
    YanSeven  
       7 小时 54 分钟前
    直接用的 claude 的 api 吗,那确实烧
    WessonC
        2
    WessonC  
       7 小时 51 分钟前
    只能中转站,但是现在中转站太 JB 乱了。
    iorilu
        3
    iorilu  
       7 小时 50 分钟前   ❤️ 2
    很多人是这么做的阿

    但是, 即使你拆的很细, 差的模型也不保证能无错完成

    这就看你取舍了, 你愿意多花时间, 甚至自己可以直接改代码的, 可以用

    如果你做不了, 那只能多花钱
    fingerxie
        4
    fingerxie  
       7 小时 49 分钟前
    我是用的 codex ,感觉不错。 大体来讲一个月 20 美刀的版本略微不够,配合公司提供的 cursor+阿里云 coding plan 刚好覆盖
    meetyuan
        5
    meetyuan  
    OP
       7 小时 41 分钟前
    @WessonC
    @YanSeven 用的中转,充了 40 ,大半天就没了,倍率也没有多高,实在扛不住了
    ooooo00000ooooo
        6
    ooooo00000ooooo  
       7 小时 39 分钟前
    就是主楼说的那样搞啊,不过不要用 Minimax ,用 GLM
    66beta
        7
    66beta  
       7 小时 38 分钟前
    试试 deepseek API ,我试了下,只看做计划,写代码的话,跟 CLAUDE 差别不大,价格那就是降维打击了
    hnbcinfo
        8
    hnbcinfo  
       7 小时 35 分钟前
    用 Claude Code Router ,把不同的任务分给不同的大模型,应该能节省成本,不过我没测试过。
    sampeng
        9
    sampeng  
       7 小时 30 分钟前
    实话说。。我也是这样做的。但你会发现 plan 也很花钱
    Sundayz
        10
    Sundayz  
       7 小时 20 分钟前
    从官方订阅,再到中转站,最后 Trae CN 白嫖免费模型,一路走下来并没有感觉到使用顶级模型的必要性,免费的模型一样能够完成工作。
    meetyuan
        11
    meetyuan  
    OP
       7 小时 19 分钟前
    @sampeng 我今天测试了,做计划确实也烧钱,但是还在接收的范围内,之前写代码和做测试,烧 token 太厉害了
    mnoputd20adfadf3
        12
    mnoputd20adfadf3  
       7 小时 14 分钟前
    高频用 GPT(敞开用)
    可以看看 我自用的 中转 aHR0cHM6Ly81ODUwMTZkMy51M3UuZGV2Lw==
    (pro + plus 号池)
    同行、看着出吧(毕竟奥特曼 经常重置额度)
    适合同行分摊成本,不做商业服务
    yiiouo
        13
    yiiouo  
       7 小时 13 分钟前
    公司有买 cursor ,一个月能用 100 美元吧,然后我自己买了 kimi ,配合 opencode 效果还可以。
    Sezxy
        14
    Sezxy  
       7 小时 9 分钟前
    腾讯云的 coding plan lite 40 元,虽然模型不是最新,但处理 crud 绰绰有余
    mnoputd20adfadf3
        15
    mnoputd20adfadf3  
       6 小时 59 分钟前
    @mnoputd20adfadf3
    刚刚注册的一个用户
    送了 一百刀 用于体验(没有倍率,和官方一样计价的)
    奥特曼,重置额度了,余量多

    薅羊毛用户,请去 商业化中转站 谢谢 ~
    请留给真有使用需求的(且高频用的)
    后续注册
    可在站内 @我 送体验额度
    YangWaleed
        16
    YangWaleed  
       6 小时 57 分钟前
    本来可以推荐 copilot 的,现在也没了
    总体上看订阅比 API 便宜,我之前是 codex + copilot 勉强够用,现在可能得两个 codex 了
    ntdll
        17
    ntdll  
       6 小时 55 分钟前
    通常是用大模型做规划和最后的审查 code review ,而小模型负责根据规划文档编码,这样可以节约 token
    AnQiYang
        18
    AnQiYang  
       6 小时 52 分钟前
    @66beta 你认真的嘛,感觉这么不现实呢
    cookii
        19
    cookii  
       6 小时 33 分钟前 via Android
    @66beta deepseek 还是差距太大了,至少也得拿 kimi 吧
    AlohaV2
        20
    AlohaV2  
       6 小时 26 分钟前
    别充年费,等等 ds
    herofire
        21
    herofire  
       6 小时 23 分钟前
    @mnoputd20adfadf3 已注册,求体验额度
    66beta
        22
    66beta  
       6 小时 22 分钟前
    @AnQiYang #18 不信就自己试一下嘛,反正我用下来差距并不大。也用了大半年了,现在公司买了 CLAUDE 我就慢慢不用了
    mnoputd20adfadf3
        23
    mnoputd20adfadf3  
       6 小时 21 分钟前
    @herofire 邮箱是多少
    base 加密发一下 谢谢
    Ethan24067
        24
    Ethan24067  
       6 小时 20 分钟前
    我自用的是 opencode 加 omo 插件,这个插件把任务细分为多个部件,你对于每个部件可以分别配置模型,这样的话,就能拆开了。类似的还有 claude code 里的 ccg-workflow ,前端派给 gemini ,后端扔给 codex ,claude 桥接和规划。
    mnoputd20adfadf3
        25
    mnoputd20adfadf3  
       6 小时 19 分钟前
    @herofire 看到你过往 回复记录了 ...
    不用邮箱了
    106npo
        26
    106npo  
       6 小时 17 分钟前 via Android
    minimax 太小了,glm 或者 kimi 吧
    mansunyunxin
        27
    mansunyunxin  
       5 小时 37 分钟前
    你问的方向是对的,但 Minimax 做执行层降级太多。更好的组合是:

    DeepSeek/GLM 做具体执行,Claude 只做规划 + 审查。

    这本质上是 Karpathy 「 Goal-Driven Execution 」的成本感知版本——不只是给目标,还要给「在什么成本约束下达到目标」。

    规划的 token 消耗经常被低估。实际上更好的分法是:
    - 大模型:规划路径 + 审查代码质量
    - 便宜模型:按规划路径执行

    DeepSeek 写代码和 Claude 差距没那么大,但价格是降维打击。省下来的预算可以多跑几轮规划。
    shea
        28
    shea  
       5 小时 30 分钟前
    @mnoputd20adfadf3 #25 大佬,我也注册了,求体验额度,c2hlYW9vY0BnbWFpbC5jb20=
    mnoputd20adfadf3
        29
    mnoputd20adfadf3  
       5 小时 12 分钟前
    @shea 已 赠送
    wengjin456123
        30
    wengjin456123  
       4 小时 50 分钟前
    @mansunyunxin ds 的 128k 上下文是不是太小了
    Elio
        31
    Elio  
       4 小时 49 分钟前
    我用的中转站 codex ,一个月才差不多四五十
    exploretheworld
        32
    exploretheworld  
       4 小时 36 分钟前
    找个能随便用的公司上班
    Panameragt
        33
    Panameragt  
       4 小时 30 分钟前
    openrouter/free
    linecode
        34
    linecode  
       4 小时 12 分钟前
    @mnoputd20adfadf3 大佬,注册了,来个体验额度,OTE1OTIxNTAwQHFxLmNvbQ==
    mnoputd20adfadf3
        35
    mnoputd20adfadf3  
       4 小时 7 分钟前
    @linecode 已 处理
    mpthink
        36
    mpthink  
       4 小时 3 分钟前
    @mnoputd20adfadf3 大佬,注册了 bXB0aGluazoxNjMuY29t
    s0f
        37
    s0f  
       3 小时 55 分钟前
    @mnoputd20adfadf3 大佬,注册了 MzE2MDI0NzYzQHFxLmNvbQ==,谢谢
    mnoputd20adfadf3
        38
    mnoputd20adfadf3  
       3 小时 47 分钟前
    @mpthink
    @s0f
    都处理了
    wangmn
        39
    wangmn  
       3 小时 46 分钟前
    可以试试我主页的中转 可以敞开用
    cryzzchen
        40
    cryzzchen  
       3 小时 31 分钟前
    @YangWaleed copilot 也没了?
    YangWaleed
        41
    YangWaleed  
       3 小时 22 分钟前
    @cryzzchen 不让新用户订阅了,而且 opus 额度大砍,要想用 opus 可能还是 Claude 官方便宜
    之前用 copilot 主要是为了 opus ,现在感觉不值得了
    jimrok
        42
    jimrok  
       3 小时 11 分钟前
    海外模型可以做一下任务制定,规格说明,给出样例代码,国产模型负责实现设计。写代码可以试试 GLM 和 kimi ,有指引的情况下,应该出来的内容不会太差。
    wanghanthu
        43
    wanghanthu  
       2 小时 48 分钟前
    老黄:The more you buy, the more you save.
    wu67
        44
    wu67  
       2 小时 48 分钟前
    @YangWaleed 不用 opus 用用 4.6 倒也还行.
    但是看到有人说会把月次数限制成周次数? 那就很尴尬了, 不过我没看到在哪有官方声明, 不知道他在哪看来的.
    YangWaleed
        45
    YangWaleed  
       2 小时 33 分钟前
    @wu67 不确定。我感觉 sonnet 4.6 是不是没 gpt-5.4 强? copilot 里这两个消耗一样,那我肯定优先用 gpt-5.4 。
    我自己感觉两个 openai plus 订阅的量够我轮换地用了,再订阅 copilot 好像有点鸡肋
    zihaogong
        46
    zihaogong  
       2 小时 30 分钟前
    @mnoputd20adfadf3 #38 NjM1NTY1OTkwQHFxLmNvbQ== 感谢
    mnoputd20adfadf3
        47
    mnoputd20adfadf3  
       2 小时 28 分钟前
    @zihaogong 已处理
    wu67
        48
    wu67  
       2 小时 28 分钟前
    @YangWaleed 我一直用 4.6, 聪明程度足够我用了. 以前 gpt5 刚出的时候我被坑过, 就再也没启用过 gpt 系列的了, 除了一个 gpt4.1 用来在高级请求耗尽时备用.
    YangWaleed
        49
    YangWaleed  
       2 小时 22 分钟前
    @wu67 我倒是反过来。一开始用 sonnet 和 opus ,后来发现 gpt-5.4 好像能力上相差无几但用量多很多,就慢慢迁移到 gpt 了。不过后来 codex 用量砍了后也撑不住我用 superpowers ,得两个号混着用才行
    wu67
        50
    wu67  
       2 小时 18 分钟前
    @YangWaleed 5.4 还有越界到处修改代码的问题吗? 不频繁的话我也试试看
    abc0123xyz
        51
    abc0123xyz  
       2 小时 17 分钟前
    别用 弱智 max ,跑个龙虾还凑合,写代码太拉了
    TheAnonymous
        52
    TheAnonymous  
       2 小时 16 分钟前
    @mnoputd20adfadf3 求体验额度 OTkzNTM3MTc4QHFxLmNvbQ==
    mnoputd20adfadf3
        53
    mnoputd20adfadf3  
       2 小时 14 分钟前
    @TheAnonymous 已处理
    imnpc
        54
    imnpc  
       2 小时 14 分钟前
    kimi + gpt
    YangWaleed
        55
    YangWaleed  
       2 小时 10 分钟前
    @wu67 我没感觉到有这种情况。不过我也不会仔细 review 代码改动,只确认修改方案。
    superpowers skills 会起一个 subagent 写代码,两个 subagent 分别 review 修改逻辑和代码质量。所以额度会肉眼可见地掉,现在我都会强调不需要这么严格的 review 才好点
    fongyip
        56
    fongyip  
       1 小时 46 分钟前 via Android
    @mnoputd20adfadf3
    哥方便给个体验额度吗?
    Zm9uZ3lpcDIwMjNAMTYzLmNvbQ==
    mnoputd20adfadf3
        57
    mnoputd20adfadf3  
       1 小时 41 分钟前
    @fongyip 已处理
    sarices
        58
    sarices  
       1 小时 38 分钟前
    @mnoputd20adfadf3 #23

    来点测试 cHJldHR5NTIzMkAxMjA3MjkueHl6
    mnoputd20adfadf3
        59
    mnoputd20adfadf3  
       1 小时 37 分钟前
    @sarices 已处理
    fuchish112
        60
    fuchish112  
       1 小时 33 分钟前
    @mnoputd20adfadf3 c29yc2hpb25AZ21haWwuY29t 大佬
    rsyjjsn
        61
    rsyjjsn  
       1 小时 26 分钟前
    用 proxifier + antigravity 直接薅谷歌的,强度不高 一周三个谷歌号,强度高你就一天一个号,反正 7 天之后就重置额度了
    justforvx
        62
    justforvx  
       1 小时 26 分钟前
    @mnoputd20adfadf3 R2F6aW5nMjgyN0AxNjMuY29t 感谢大佬
    mnoputd20adfadf3
        63
    mnoputd20adfadf3  
       1 小时 24 分钟前
    @fuchish112
    @justforvx
    已处理
    xinshu
        64
    xinshu  
       1 小时 16 分钟前
    @mnoputd20adfadf3 d2hvaXMueGluc2h1QGdtYWlsLmNvbQ== 感谢大佬
    thedustoooo
        65
    thedustoooo  
       1 小时 14 分钟前
    @mnoputd20adfadf3 ZGVzdGlueW9vb29AMTI2LmNvbQ== 大佬
    luckyxl
        66
    luckyxl  
       1 小时 10 分钟前
    @mnoputd20adfadf3 7CefPvGBexCUijc6JXHoAk 感谢大佬
    PPZZPP
        67
    PPZZPP  
       1 小时 7 分钟前
    @mnoputd20adfadf3 大佬,注册了 YTEzMjc5MzkxNTdAZ21haWwuY29t
    ThunStorm
        68
    ThunStorm  
       1 小时 5 分钟前 via Android
    @mnoputd20adfadf3 ZjE1MTV4Y25AZ21haWwuY29t 感谢大佬
    luckyxl
        69
    luckyxl  
       1 小时 4 分钟前
    @mnoputd20adfadf3 Mjc5NDc0Mzg2QHFxLmNvbQ== 感谢大佬
    meetyuan
        70
    meetyuan  
    OP
       1 小时 3 分钟前   ❤️ 1
    @mnoputd20adfadf3 哥,感谢你的回复,要不你在开个推广帖子吧,我一定支持!

    我这里主要是想讨论下怎么多模型配合使用,现在有点乱了。
    luck2023
        71
    luck2023  
       58 分钟前 via Android
    @mnoputd20adfadf3 注册好了,Y29uZmlkZW5jZXMyMDIzQGdtYWlsLmNvbQ==
    mnoputd20adfadf3
        72
    mnoputd20adfadf3  
       55 分钟前
    @meetyuan 不好意思哈 🤡
    么么哒 ~

    请不要在 @ 我了
    余量也不够了
    感恩 🥹 🥹 🥹
    program9527
        73
    program9527  
       51 分钟前
    最近看了下视频生成的。google 的 veo ,sora 、即梦好像价格都非常高。有什么低成本的方案吗
    lodelo
        74
    lodelo  
       49 分钟前
    @mnoputd20adfadf3 MTc1ODQzNzY3QHFxLmNvbQ== 感谢大佬
    wclebb
        75
    wclebb  
       46 分钟前
    认真讲,如果你能用大模型免费写代码,那么就没有这个岗位了。
    ls006009
        76
    ls006009  
       40 分钟前
    @mnoputd20adfadf3 大佬, 注册好了, 求体验额度, bHMwMDYwQDE2My5jb20= 谢谢
    zhangdashuan
        77
    zhangdashuan  
       38 分钟前
    @mnoputd20adfadf3 #12 大佬,已注册,求体验额度。MzIwMDI0MTE0MkBxcS5jb20=
    vincentwu
        78
    vincentwu  
       24 分钟前
    @mnoputd20adfadf3 大佬已注册,d3lsd2lsbDAyMTJAMTYzLmNvbQ==
    kevan
        79
    kevan  
       21 分钟前
    @mnoputd20adfadf3 我注册了 ID: am95bXVzaWNAMTYzLmNvbQo=
    teaguexiao
        80
    teaguexiao  
       11 分钟前
    用 Claude Code 的话可以在 CLAUDE.md 里将需求和架构写详细,让 Sonnet 做执行,只在关键定义和架构评审时再切回 Opus ,这样一天的费用能控在十块内。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4195 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 145ms · UTC 10:16 · PVG 18:16 · LAX 03:16 · JFK 06:16
    ♥ Do have faith in what you're doing.