如题,在北美一家偏传统的科技公司当苦力,基础、安全和应用三头管的 Corporate 架构师。这几年实在是干伤了,上月提了离职,这月底正式滚蛋。接下来的离职生活主打一个养生,打算歇个一年半载,把静息心率调下来,顺便修一修脂肪肝和肾结石。
空档期不打算彻底闲着,手里有几个跑了很久、已经对外收费的冷门服务准备高强度迭代一波,还想再折腾点新工具。虽然是做架构出身,但实际职业生涯里亲自手搓代码的日子也就占个 10% 左右,所以接下来的开发得重度依赖 AI 帮我干活,包括撸代码、debug 和重构。
介绍下目前的使用场景: 我自己写了一个 24x7 自动开发测试上线的框架,DeepSeek 直接挂在里面跑。算了一下单日平均大概 3.3 亿 token ,4500 次左右的请求。这块因为缓存命中率极高( 97% 左右),跑得挺稳,成本跟土一样便宜。虽然它效率相比很低,但好在便宜又会自动纠错,平时不用我操心,出来的 Web 或其他 GUI 的最终成品一般很丑,最终我会再半手动去完善一下 UI/UX 。
现在纠结的是前台交互: 以前在公司习惯了企业版 Copilot 和原厂 API 无限随便造,导致我对各大厂商针对个人的 Coding Plan 真是不太了解。自己有个 Google AI Pro (公司报销),但那个限额简直是一言难尽,白嫖都嫌碍事,刚给降级关了。当然,如果大伙觉得它家那个 Ultra 档位确实能打,我也考虑再开回来。
离职后每天会有大把时间跟 AI 高频对话,算是典型的高强度场景。想请教下各位,先不聊 Cursor 或者 Windsurf 这些壳子,只看底层模型的大杯订阅(比如 Claude 的 Pro/Max 档,或者 OpenAI 的高阶订阅),买哪家最不容易降智?如果能量大管饱到可以让我低成本替换掉后台 24 小时跑的 DeekSeek API 那就最好了。
最核心的诉求:千万别写到一半突然给我卡限流,或者用着用着模型就变笨了。
(月底离职那天会去搞个 64G RAM 的 M5 Pro 顶配,但不打算用来跑常驻的 LLM)
求个有类似高强度实战经验的老哥给点建议,先谢过各位。
1
sNullp 2 小时 20 分钟前 via iPhone 不打算搞个 rtx pro 6000 跑个 32B 模型嘛
|
2
sddyzm 2 小时 2 分钟前 via iPhone 说实在的休息就休息
|