AI 太烧钱了，有什么好的大模型组合方案？

meetyuan · 2026-04-21T02:20:40Z

用 AI 生成计划，写代码，用 claude-opus-4-6 半天烧了四十多，这样下去扛不住。我就想能不能使用 claude 或者 gpt 写计划，指定好详细的开发计划和实施流程，然后让 minimax(我买了一个月的 plus ，放那里快到期了)来完成实施过程以及测试？各位高手有什么建议没有？

大模型

组合方案

成本

109 replies • 2026-06-26 23:05:17 +08:00

1 2

❮

❯

1

YanSeven

Apr 21

直接用的 claude 的 api 吗，那确实烧

2

WessonC

Apr 21

只能中转站，但是现在中转站太 JB 乱了。

3

iorilu

Apr 21

3

很多人是这么做的阿

但是, 即使你拆的很细, 差的模型也不保证能无错完成

这就看你取舍了, 你愿意多花时间, 甚至自己可以直接改代码的, 可以用

如果你做不了, 那只能多花钱

4

fingerxie

Apr 21

我是用的 codex ，感觉不错。大体来讲一个月 20 美刀的版本略微不够，配合公司提供的 cursor+阿里云 coding plan 刚好覆盖

5

meetyuan

OP

Apr 21

@WessonC
@YanSeven 用的中转，充了 40 ，大半天就没了，倍率也没有多高，实在扛不住了

6

ooooo00000ooooo

Apr 21

就是主楼说的那样搞啊，不过不要用 Minimax ，用 GLM

7

66beta

Apr 21

试试 deepseek API ，我试了下，只看做计划，写代码的话，跟 CLAUDE 差别不大，价格那就是降维打击了

8

hnbcinfo

Apr 21

用 Claude Code Router ，把不同的任务分给不同的大模型，应该能节省成本，不过我没测试过。

9

sampeng

Apr 21

实话说。。我也是这样做的。但你会发现 plan 也很花钱

10

Sundayz

Apr 21

从官方订阅，再到中转站，最后 Trae CN 白嫖免费模型，一路走下来并没有感觉到使用顶级模型的必要性，免费的模型一样能够完成工作。

11

meetyuan

OP

Apr 21

@sampeng 我今天测试了，做计划确实也烧钱，但是还在接收的范围内，之前写代码和做测试，烧 token 太厉害了

12

mnoputd20adfadf3

Apr 21

高频用 GPT(敞开用)
可以看看我自用的中转 aHR0cHM6Ly81ODUwMTZkMy51M3UuZGV2Lw==
(pro + plus 号池)
同行、看着出吧(毕竟奥特曼经常重置额度)
适合同行分摊成本，不做商业服务

13

yiiouo

Apr 21

公司有买 cursor ，一个月能用 100 美元吧，然后我自己买了 kimi ，配合 opencode 效果还可以。

14

Sezxy

Apr 21

腾讯云的 coding plan lite 40 元，虽然模型不是最新，但处理 crud 绰绰有余

15

mnoputd20adfadf3

Apr 21

@mnoputd20adfadf3
刚刚注册的一个用户
送了一百刀用于体验(没有倍率,和官方一样计价的)
奥特曼,重置额度了,余量多

薅羊毛用户,请去商业化中转站谢谢 ~
请留给真有使用需求的(且高频用的)
后续注册
可在站内 @我送体验额度

16

YangWaleed

Apr 21

本来可以推荐 copilot 的，现在也没了
总体上看订阅比 API 便宜，我之前是 codex + copilot 勉强够用，现在可能得两个 codex 了

17

ntdll

Apr 21

通常是用大模型做规划和最后的审查 code review ，而小模型负责根据规划文档编码，这样可以节约 token

18

AnQiYang

Apr 21

@66beta 你认真的嘛，感觉这么不现实呢

19

cookii

Apr 21 via Android

@66beta deepseek 还是差距太大了，至少也得拿 kimi 吧

20

AlohaV2

Apr 21

别充年费，等等 ds

21

herofire

Apr 21

@mnoputd20adfadf3 已注册，求体验额度

22

66beta

Apr 21

@AnQiYang #18 不信就自己试一下嘛，反正我用下来差距并不大。也用了大半年了，现在公司买了 CLAUDE 我就慢慢不用了

23

mnoputd20adfadf3

Apr 21

@herofire 邮箱是多少
base 加密发一下谢谢

24

Ethan24067

Apr 21

我自用的是 opencode 加 omo 插件，这个插件把任务细分为多个部件，你对于每个部件可以分别配置模型，这样的话，就能拆开了。类似的还有 claude code 里的 ccg-workflow ，前端派给 gemini ，后端扔给 codex ，claude 桥接和规划。

25

mnoputd20adfadf3

Apr 21

@herofire 看到你过往回复记录了 ...
不用邮箱了

26

106npo

Apr 21 via Android

minimax 太小了，glm 或者 kimi 吧

27

mansunyunxin

Apr 21

你问的方向是对的，但 Minimax 做执行层降级太多。更好的组合是：

DeepSeek/GLM 做具体执行，Claude 只做规划 + 审查。

这本质上是 Karpathy 「 Goal-Driven Execution 」的成本感知版本——不只是给目标，还要给「在什么成本约束下达到目标」。

规划的 token 消耗经常被低估。实际上更好的分法是：
- 大模型：规划路径 + 审查代码质量
- 便宜模型：按规划路径执行

DeepSeek 写代码和 Claude 差距没那么大，但价格是降维打击。省下来的预算可以多跑几轮规划。

28

shea

Apr 21

@mnoputd20adfadf3 #25 大佬,我也注册了,求体验额度,c2hlYW9vY0BnbWFpbC5jb20=

29

mnoputd20adfadf3

Apr 21

@shea 已赠送

30

wengjin456123

Apr 21

@mansunyunxin ds 的 128k 上下文是不是太小了

31

Elio

Apr 21

我用的中转站 codex ，一个月才差不多四五十

32

exploretheworld

Apr 21

找个能随便用的公司上班

33

Panameragt

Apr 21

openrouter/free

34

linecode

Apr 21

@mnoputd20adfadf3 大佬，注册了，来个体验额度，OTE1OTIxNTAwQHFxLmNvbQ==

35

mnoputd20adfadf3

Apr 21

@linecode 已处理

36

mpthink

Apr 21

@mnoputd20adfadf3 大佬，注册了 bXB0aGluazoxNjMuY29t

37

s0f

Apr 21

@mnoputd20adfadf3 大佬，注册了 MzE2MDI0NzYzQHFxLmNvbQ==，谢谢

38

mnoputd20adfadf3

Apr 21

@mpthink
@s0f
都处理了

39

wangmn

Apr 21

可以试试我主页的中转可以敞开用

40

cryzzchen

Apr 21

@YangWaleed copilot 也没了？

41

YangWaleed

Apr 21

@cryzzchen 不让新用户订阅了，而且 opus 额度大砍，要想用 opus 可能还是 Claude 官方便宜
之前用 copilot 主要是为了 opus ，现在感觉不值得了

42

jimrok

Apr 21

海外模型可以做一下任务制定，规格说明，给出样例代码，国产模型负责实现设计。写代码可以试试 GLM 和 kimi ，有指引的情况下，应该出来的内容不会太差。

43

wanghanthu

Apr 21

老黄：The more you buy, the more you save.

44

wu67

Apr 21

@YangWaleed 不用 opus 用用 4.6 倒也还行.
但是看到有人说会把月次数限制成周次数? 那就很尴尬了, 不过我没看到在哪有官方声明, 不知道他在哪看来的.

45

YangWaleed

Apr 21

@wu67 不确定。我感觉 sonnet 4.6 是不是没 gpt-5.4 强？ copilot 里这两个消耗一样，那我肯定优先用 gpt-5.4 。
我自己感觉两个 openai plus 订阅的量够我轮换地用了，再订阅 copilot 好像有点鸡肋

46

zihaogong

Apr 21

@mnoputd20adfadf3 #38 NjM1NTY1OTkwQHFxLmNvbQ== 感谢

47

mnoputd20adfadf3

Apr 21

@zihaogong 已处理

48

wu67

Apr 21

@YangWaleed 我一直用 4.6, 聪明程度足够我用了. 以前 gpt5 刚出的时候我被坑过, 就再也没启用过 gpt 系列的了, 除了一个 gpt4.1 用来在高级请求耗尽时备用.

49

YangWaleed

Apr 21

@wu67 我倒是反过来。一开始用 sonnet 和 opus ，后来发现 gpt-5.4 好像能力上相差无几但用量多很多，就慢慢迁移到 gpt 了。不过后来 codex 用量砍了后也撑不住我用 superpowers ，得两个号混着用才行

50

wu67

Apr 21

@YangWaleed 5.4 还有越界到处修改代码的问题吗? 不频繁的话我也试试看

51

abc0123xyz

Apr 21

别用弱智 max ，跑个龙虾还凑合，写代码太拉了

52

TheAnonymous

Apr 21

@mnoputd20adfadf3 求体验额度 OTkzNTM3MTc4QHFxLmNvbQ==

53

mnoputd20adfadf3

Apr 21

@TheAnonymous 已处理

54

imnpc

Apr 21

kimi + gpt

55

YangWaleed

Apr 21

@wu67 我没感觉到有这种情况。不过我也不会仔细 review 代码改动，只确认修改方案。
superpowers skills 会起一个 subagent 写代码，两个 subagent 分别 review 修改逻辑和代码质量。所以额度会肉眼可见地掉，现在我都会强调不需要这么严格的 review 才好点

56

fongyip

Apr 21 via Android

@mnoputd20adfadf3
哥方便给个体验额度吗？
Zm9uZ3lpcDIwMjNAMTYzLmNvbQ==

57

mnoputd20adfadf3

Apr 21

@fongyip 已处理

58

sarices

Apr 21

@mnoputd20adfadf3 #23

来点测试 cHJldHR5NTIzMkAxMjA3MjkueHl6

59

mnoputd20adfadf3

Apr 21

@sarices 已处理

60

fuchish112

Apr 21

@mnoputd20adfadf3 c29yc2hpb25AZ21haWwuY29t 大佬

61

rsyjjsn

Apr 21

用 proxifier + antigravity 直接薅谷歌的，强度不高一周三个谷歌号，强度高你就一天一个号，反正 7 天之后就重置额度了

62

justforvx

Apr 21

@mnoputd20adfadf3 R2F6aW5nMjgyN0AxNjMuY29t 感谢大佬

63

mnoputd20adfadf3

Apr 21

@fuchish112
@justforvx
已处理

64

xinshu

Apr 21

@mnoputd20adfadf3 d2hvaXMueGluc2h1QGdtYWlsLmNvbQ== 感谢大佬

65

thedustoooo

Apr 21

@mnoputd20adfadf3 ZGVzdGlueW9vb29AMTI2LmNvbQ== 大佬

66

luckyxl

Apr 21

@mnoputd20adfadf3 7CefPvGBexCUijc6JXHoAk 感谢大佬

67

PPZZPP

Apr 21

@mnoputd20adfadf3 大佬，注册了 YTEzMjc5MzkxNTdAZ21haWwuY29t

68

ThunStorm

Apr 21 via Android

@mnoputd20adfadf3 ZjE1MTV4Y25AZ21haWwuY29t 感谢大佬

69

luckyxl

Apr 21

@mnoputd20adfadf3 Mjc5NDc0Mzg2QHFxLmNvbQ== 感谢大佬

70

meetyuan

OP

Apr 21

1

@mnoputd20adfadf3 哥，感谢你的回复，要不你在开个推广帖子吧，我一定支持！

我这里主要是想讨论下怎么多模型配合使用，现在有点乱了。

71

luck2023

Apr 21 via Android

@mnoputd20adfadf3 注册好了，Y29uZmlkZW5jZXMyMDIzQGdtYWlsLmNvbQ==

72

mnoputd20adfadf3

Apr 21

@meetyuan 不好意思哈 🤡
么么哒 ~

请不要在 @ 我了
余量也不够了
感恩 🥹 🥹 🥹

73

program9527

Apr 21

最近看了下视频生成的。google 的 veo ，sora 、即梦好像价格都非常高。有什么低成本的方案吗

74

lodelo

Apr 21

@mnoputd20adfadf3 MTc1ODQzNzY3QHFxLmNvbQ== 感谢大佬

75

wclebb

Apr 21

认真讲，如果你能用大模型免费写代码，那么就没有这个岗位了。

76

ls006009

Apr 21

@mnoputd20adfadf3 大佬, 注册好了, 求体验额度, bHMwMDYwQDE2My5jb20= 谢谢

77

zhangdashuan

Apr 21

@mnoputd20adfadf3 #12 大佬，已注册，求体验额度。MzIwMDI0MTE0MkBxcS5jb20=

78

vincentwu

Apr 21

@mnoputd20adfadf3 大佬已注册，d3lsd2lsbDAyMTJAMTYzLmNvbQ==

79

kevan

Apr 21

@mnoputd20adfadf3 我注册了 ID: am95bXVzaWNAMTYzLmNvbQo=

80

teaguexiao

Apr 21

用 Claude Code 的话可以在 CLAUDE.md 里将需求和架构写详细，让 Sonnet 做执行，只在关键定义和架构评审时再切回 Opus ，这样一天的费用能控在十块内。

81

XUEHAIWUYA

Apr 21

找个正规的中转，或者 token 是不是确实用的多

82

Lutto

Apr 21

我半天用了 100 美金的 token……

83

chenzezeya

Apr 21

哥方便来点～ NDQ4MTY1MzE1QHFxLmNvbQ==
@mnoputd20adfadf3

84

gaoxiaoxin

Apr 21

MTUwOTQzNDY3NGdhb0BnbWFpbC5jb20= 感谢大佬 @mnoputd20adfadf3

85

soFollish

Apr 21

emh1YW5nemh1YW5nemhvdWlAZ21haWwuY29t 感谢老板 @mnoputd20adfadf3

86

sarices

Apr 21

1

@mnoputd20adfadf3 #59
速度还可以，挺不错的，用一段时间看看

87

mach9452

Apr 21

贵就对了，我还没失业就是因为 AI 比我贵[doge/]

88

mackes

Apr 21

@mnoputd20adfadf3 老哥，刚注册了一个用户名 mackes

89

mackes

Apr 21

@Elio 老哥可以分享一下吗？

90

hais1992

Apr 21

@mnoputd20adfadf3 aGFpczE5OTJAMTYzLmNvbQ== 求体验额度，已注册，多谢大佬~

91

gotoschool

Apr 21

@mackes #89 留联系方式

92

mackes

Apr 21

@gotoschool bWFja2VzNzRAZ21haWwuY29t 谢谢

93

distance7509

Apr 21

我感觉中转站的话，还不如官方拼车，中转站的消耗太快了

94

panzhc

Apr 22

用量大的话，直接买 chatgpt pro 套餐，$200 的一个人用应该足够了。

95

meetyuan

OP

Apr 22

@teaguexiao 这个我要试试，谢谢大佬！

96

meetyuan

OP

Apr 22

@rsyjjsn 不看评分的话，gemini 和 claude 用起来差别大吗？

97

actopas

Apr 22

直接就 claude max 就完事了一个月 700 上下

98

rsyjjsn

Apr 22

@meetyuan 个人感觉差距不太多但肯定是 claude 最好用，比如生成一个页面，gemini 可能完成度 80% claude 大概有 90%

99

doyel

Apr 22

@mnoputd20adfadf3 #12 大哥注册关闭吗。。。

100

simo

Apr 22

我目前用的，可以参考下：
codex: 一天持续 8 个小时，两个 openai plus 够用了。 [持续记录改进文档，方便新开会话。会话多了，就重开。遇到一次，会话到 3G ，一轮就消耗 1/3 5 小时 plus 用量]
minimax 跑龙虾，日常工具性任务，足够。一年不到 500 。
反重力：年付的，基本废了，维护之前的项目用。
opencode go：10$那个，glm5 量很小，做做小工具用。
自建备用，主要 qwen 3.6 35B

建议可以上一个 openai plus ，如果能用一周，那就一个号够了，20$，应该是最划算的了。

1 2

❮

❯