Agentic Coding 两年，分享一下对圈内的看法（第二部分，有干货）

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

幻影忍者前情提要

（ Linux DO 版）：Vibe Coding 了两年，分享一下自己对于这个圈子的感想。

（ V2EX 版）：Vibe Coding 了两年，分享一下自己对于这个圈子的感想。

嗨嗨嗨伙计们我又来继续分享了，不好意思这个饭吃得有点慢（迫真）

现在刚好在火车站等火车，闲着也是闲着，那就开写！

以下为个人观点，基本上全是暴论，不喜勿喷，给孩子留点面子吧😭

首先来解答一下很多伙计们问我的问题：

Vibe Coding 真的适合所有人吗？

我看不见得。

毋庸置疑，Vibe Coding 拉低了创造产品的门槛。但是请不要盲目跟风。

记住一个原则：当你的工作流能跑通并且效率能符合你的需求的时候，尽量不要动它。因为每引入一项流程都会让整个工作流变得不可控，流程规模和工作流的维护难度之间的关系可能达到甚至超越 O(n^2)。

于是在生产环境使用 Vibe Coding 只能有两种情况：

你的工作流跑不通，需要用 Vibe 一个新工具补全一下你的工作流
工作流效率太特喵的慢了，只能勉强用甚至几乎不可用

这两种情况下要想很好地使用 Vibe Coding 基本上都是需要你对工作流有很深入的了解。

怎么增进对自己工作流的了解呢？我这里有一个我摸索出来的办法——让 AI 帮你进行脑暴。脑暴真的是一个很好用的方法，上篇帖子给伙计们的回复已经提到过原理，不再赘述。

具体操作方法是找一个综合能力接近或强于 DeepSeek V4 Pro 的 LLM （ Flash 不行，世界知识有所欠缺），把你的工作和工作流详细讲给它听，让它调用 Skill 进行脑暴。它会在这个阶段不断提问你它认为你没表述清楚的片段。然后它就会把它认为有所欠缺的地方总结一下输出给你。

过几天我会做一个 Skill 来分享给大家，大家可以对自己的工作流进行自查。配合 Superpowers Brainstorming 食用更佳（）

但是还有两类人，他们跟工作流这个概念基本沾不到边，但我认为他们使用 Vibe 也是应当的：

一是在 Vibe 过程中学习工程思维和计算机知识的学生。

正如我说，国内 CS 高等教育实在还是太抽象了，Vibe Coding 就相当于让他们在就业前就提前接触先进的生产工具，让他们更好迎接未来，而不是被困在每天只能 Dev C++ 的课堂里，用着学校祖传的比自己年纪还大的、并发一多就乱报 WA 的 OJ 系统。而且不建议他们纯 Vibe ，一定要结合自己所学（比如控制论、工程思维）来进行 Vibe 。

二是拿 Vibe Coding 来进行娱乐的人。这类人基本属于跳出了开发者的评价体系，不在五行之中了。毕竟 Vibe 是真的好玩，在我看来超越大多数游戏的娱乐性，达到星露谷的上头水平了。

什么，你说二游？拜托，二游全是靠故事和设定撑起来的，这年头的二游的游戏性只要不为负数就算赢了（悲）

所以把 Vibe 当成新时代游戏也并非不可，只是要给万恶的 LLM 提供商交保护费这点太难蚌了😠

就先写到这里吧，上火车之后继续写，毕竟火车上有 24 小时 3 分钟可以让我往死里写（）

vibe

工作流

编程

2 replies

SoraStar

4h 12m ago

刚才看到一个新问题，很感兴趣，就来顺手答一下：[请问在模型 API +提示词一样的前提下，Agent 的作用有多大呢？]( https://linux.do/t/topic/2443484)

我们知道，模型决定智力，提示词决定输出方式和输出质量，那 Agent 决定了什么呢？

我们来打个比方吧，还是用上次那个做菜的比喻：

模型相当于可以不断产出食材的机器，提示词代表了你的做菜经验，咱有了这俩样玩意儿，是不是感觉缺了什么？

没错，Agent 就是厨房和厨具。它作为一个摆满了厨具的厨房，给了你一个可以用厨具自由发挥你的做菜经验的场地。只不过对于 Agentic Coding 而言，使用厨具是无感的、自动化的。而且它还会自动优化你的做菜体验，相当于智能厨房。

对应到现实，Agent 提供了一个可以使用提示词与模型交互获得输出的环境。

它会在你和模型交互中自动优化这个过程。比如优化你的上下文结构进行 KV Cache 命中优化、压缩你的上下文、让模型能更方便读取 Skills 和 MCPs 来优化自己的输出。

亦或者是给你提供一些自动化工具。比如使用 Loop （ Claude Code 里叫做 /goal ）来进行大模型循环，让模型直到达到目标才停止。

最后就是给了模型自动化读取外界信息的能力，这样你就不用自己去获取外界信息来输入给 LLM 了，而是模型会自己去找。

总之就是这样。

SoraStar

2h 21m ago

其实用什么模型完全得看你的 Coding 方式。

上文提到了几种 Coding 方式：

"Vibe 还是有很多程度上的区分的：

首先是原教旨 Vibe 。这类人坚定不移地走 Andrej Karpathy 的路线，坚持全程使用 AI 编程不动摇。这种人已经相当于机械飞升了，写出来的代码可以类比成 40K 世界里的人类之于现实人类——简单来说就已经不是人了。通常来说，这类人的能力上限极高，下限也极低。

上限极高的前提是成为掌管提示词工程的神、同时用 Harness Prompt 把 AI 调成星怒；下限就是那种说不清自己需求的人，典型案例就是告诉对方“我要五彩斑斓的黑”的甲方，产出来的全是类似于克苏鲁一样的不可名状的生物。

其次是把 AI 当成赛博义体来用的重度使用者，这群人中的强者不会完全用 AI 来写，而是自己先写好设计文档和架构文档。更有甚者还会实现好关键部分，其它全部用空壳函数占个位，然后再在旁边写好注释，AI 只用负责填空。这使得他们的活可以只用低参数 LLM 解决，这是其它几种都做不到的。而弱一点的虽然写得比 AI 还差，但至少 AI 会帮他们兜个底，他们的基本逻辑还是能跑通的。

最后是 AI 的轻度使用者，这种人偶尔用 AI 写个 MVP 最小化验证一下自己的思路，或者用 AI 改一下他们改不来的错。他们的大多数代码都是自己写的，所以有没有 AI 对他们影响不大。"

参考 B 站 UP 主 “图灵坐标” 的分类方式，我们把模型能力分为以下六种：编码能力、工具调用、指令遵循、长文本推理、学术认知边界（也就是世界知识）、事实可靠性。然后我在模型能力之外加上两种参考坐标：多模态能力、性价比、输出速度。

对于原教旨 Vibe 来说，他们对模型的某些能力要求极高，因为模型是主要的输出者，这要求模型有较强的编码能力、工具调用能力。而现阶段市面上 Claude 4.6 系列模型（ Opus 、Sonnet ）、GPT 5.5 都属于此列。

对于把 AI 当义体来用的人来说，AI 纯纯只是个填空工具，写出代码主要还是靠人。这要求模型有较强的编码能力，其次是指令遵循。而现阶段符合该条件的模型是 DeepSeek V4 Pro/Flash 、Qwen 3.7 Max 、GLM 5.1+ 以及前面两个提到的模型系列。这里推荐国模。因为你单纯拿来填空，给 A\ 和 CloseAI 交那么多钱多少有点不太合适。

然后还有一类人，是把 AI 用来重构的，这类人需要的是超强的长文本推理和编码能力。这里国模只有 GLM 5.2 和 Qwen 3.7 Max 比较适合这类工作。要想自己的项目不被修垮，只能硬着头皮选 Claude 和 GPT 了。

拿 AI 学知识的人需要的是工具调用能力（毕竟要 Web Search ）、世界知识、事实可靠性。Gemini 系列模型和 DeepSeek V4 Pro 最适合他们。记住，千万别去选 Gemini 3.5 Flash ，不然你真会变成哈基米，对着模型哈气的。

甚至有人拿 AI 辅助思考，我不会这么做，但我尊重理解祝福。这类人需要的是长文本推理、世界知识、事实可靠性强的模型。梁叔叔的 DeepSeek V4 Pro 和 Google 的 Gemini 3.1 Pro 是最适合的。

至于那些只是单纯拿 AI 当扳手，没有 AI 也能手拧螺母的狠人，模型能力强不强跟他们没啥关系。他们甚至拿个 MiniMax M2.5 （！？区区？！）都能做可行性验证。

然后是多模态能力，这个对于 Coding 来说只能作为加分项，不能作为决定项。但是对于日常使用还是挺有帮助的。

最后，不得不提一下为什么不选 MiniMax M3 和 MiMo 2.5 Pro 。因为输出速度实在太特喵的慢了！！！！人家拿着 DeepSeek V4 Flash 都 Debug 完几轮了你还在慢慢进行精雕细琢（点名 M3 ），有的甚至慢工出烂活（ MiMo ），真的让人绷不住。

不过，这里有个输出速度的极端：MiMo 2.5 Pro UltraSpeed 。没错，最快最慢都是小米！ 1000+ Token 每秒，大力出奇迹，写得烂没关系，你写一遍的时间我能写完一遍再 Debug 好几遍😋但是这玩意儿现在不在评价体系里面，因为几乎申请不到。