我知道这个标题很冲,但我说的是真心话。
今天看到"AI 编程不过如此"的帖子,点进去一看,不是在吐槽不准,就是在说离做的好差很远。说实话这些我都经历过,去年我也是这个看法。
但现在的 AI 编程已经完全不是那个东西了。
我现在的工作流大概是这样:
我是项目经理,AI 是干活的工程师团队。
不是比喻,是字面意思。我描述需求和约束,agent 自己读项目源码、理解模块关系、开分支写实现、build 报错自己看 log 改、跑通测试、提 PR 。我 review 完 merge 。一个中等复杂度的功能,从描述到 merge 可能就 20 分钟。
这里面几个关键的东西缺一不可:
1. 模型能力是底座
Opus 4.6 这个级别的模型,上下文理解和代码推理能力跟之前的模型真的不是一回事。不是"更好一点",是质变。它能在一个几万行的项目里自己翻文件找依赖,写出来的代码风格跟项目一致。之前的模型做不到这个。
2. Agent 是手和脚
光有聪明的大脑没用,得能自己操作。Agent 工作流让模型不再是个对话框,而是一个能读文件、跑命令、看报错、自己迭代修复的执行者。这个差距就像你跟一个人微信聊技术方案 vs 直接让他坐你旁边开电脑干活。
3. Skills 是经验
你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。
4. MCP 是工具箱
让 agent 能直接操作外部工具和服务——数据库、API 、CI/CD 、各种 SaaS 。不是让你手动复制粘贴中间结果,而是 agent 自己调用、自己处理返回值、自己决定下一步。
这四个东西组合起来,才是 2026 年 AI 编程该有的样子。你拿 2024 年的 Copilot 体验来评价现在的 AI 编程,就像拿塞班手机的体验来评价智能手机一样荒谬。
我不是说 AI 能取代程序员——架构决策、需求判断、代码 review 这些还得人来。但执行层面的效率提升是 5-10 倍,这个不夸张。以前要写半天的东西,现在真的是描述清楚然后等 20 分钟。
所以当我看到有人还在说"AI 编程就是个玩具"的时候,我真的很想问一句:你用的是什么?什么时候的东西?
不是所有 AI 编程都叫 AI 编程。
有同感的吗?或者有人用了完整工具链之后觉得也不过如此的,也欢迎来说说。
1
Alias4ck 5 小时 1 分钟前
仔细想起来, 没 AI 之前人解决大部分的问题也和这个模式差不多
|
2
florentino 4 小时 58 分钟前 现在最主要的问题是他妈的 claude 封号
|
3
xiahl1990 4 小时 57 分钟前
是这样的思路
|
4
nc 4 小时 56 分钟前
skills 和 mcp 没啥用,特别是 mcp ,污染上下文
|
5
cvbnt 4 小时 56 分钟前
大概一年前 cursor 也有人说不会 cursor 就不配谈编程,现在变化太快,我无法想象半年后会推出什么样的东西
|
6
dodoa OP @florentino #2 我 AppStore 开的 max ,自己用 2 年了 大部分时间都是美国节点,偶尔也会新加坡、日本、台湾来回切,从来没封过
|
7
JYii 4 小时 55 分钟前
我只想知道所谓的 AI 测试什么样子。
单测里都是 happy path + 浅断言? 追求分支覆盖率爆炸代码量? 多 step 、第三方系统调用全靠 mock ? 针对复杂业务如何全条件回归测试? 我昨天在其他帖子也有同样疑问。 |
8
Zenon 4 小时 54 分钟前
要钱的啊,那算了
|
10
remember5 4 小时 49 分钟前
日常开发中 mcp 用的很少了,转 skills 了
|
11
liu731 PRO 只用 WPS,没用过 Office 的人不足以谈电脑办公
|
12
jrtzxh020 4 小时 48 分钟前 目前最大的问题是 token 哗哗的没了
|
13
YanSeven 4 小时 47 分钟前
赞同。
|
14
soleils 4 小时 41 分钟前
之前我就发过贴, 太多人用着国内 TRAE, 用 DeepSeek 模型写代码,然后说 AI 编程垃圾
|
15
apkapb 4 小时 38 分钟前
skill 在 ai 编程这块确实非常重要, 是一个 AI 编程的重要组成部分;
它的原理一点不复杂,但是需要一个人、一个组织去推动,去统一规范。 ---- 特别是 curd 项目,要增加一个功能,api endpoint 怎么写,biz 层怎么写,redis 中有哪些注意的点,慢慢把这些 skill 补齐。你就会发现,AI 写得比我好,完全没有屎山的样子(它写得都是屎山了,那我写得是啥了....) |
16
outman87 4 小时 38 分钟前
opus4.6 在 copilot 中是三倍的 token 消耗速度...
|
17
hxzhouh1 4 小时 37 分钟前 @liu731 你这是抬杠,
op 说 opus4.6 可能是 有点狭隘了,毕竟我用 codex 中的 gpt 5.4 执行这一套流程 也行。 但是 agents + skills + mcp 这一套确实可以极大的提高生产力。 跟 wps 与 office 这种对比完全不一样。 |
18
bigxixi 4 小时 35 分钟前 好奇 AI 怎么做真机测试?我们有的 H5 项目,调动效和兼容性,都是 qa 拿几十个不同型号不同系统版本的手机,视觉和动效逐个对着调的,经常有那种不报错但画面就是不对的情况(不仅仅是 CSS ),需要肉眼验证再改。
opus4.6 很强,但体验下来他也做不到兼容很多老旧机型或者特定版本,比如 iOS 17.3.1 的某个 bug ,其他版本没有(往前的没出现,往后的修复了),但后台数据告诉你这个版本的用户数量不能忽视,而且大概率是钉子户不愿升级系统或者换手机那种,这种我们人工验证个几天总能找出来处理,AI 怎么验证呢? 我能想到的就是每个手机用一个摄像头对着屏幕,如果带交互的就用机械手操作(虚拟操作会引入其他 bug ),这样静态的视觉 bug 我理解可以找出来,动效 bug 能行吗? ![]() ![]() |
19
dodoa OP @JYii #7 AI 能写测试代码,但不能做测试设计
人(或者 AI 帮你)定义测试场景和关键断言(哪些条件组合、预期什么行为、哪 些边界必须覆盖) AI 负责把这些场景翻译成测试代码( setup 、teardown 、fixture 、具体的 assert 写法) 复杂业务的条件矩阵,人来画表格,AI 来生成对应的 parameterized test 针对复杂业务如何全条件回归测试?(不是技术做不到,是需要人来设计这套东西) 假设你要测"用户注册 → 邮箱验证 → 首次登录 → 引导流程"这条链路: ``` 人:定义场景 ├── 正常注册 → 点验证链接 → 登录成功 → 看到引导 ├── 注册后不验证 → 登录被拒 → 提示重发邮件 ├── 验证链接过期 → 重新申请 → 新链接有效 └── 重复注册同一邮箱 → 报错提示 AI:执行 ├── 起 postgres + redis + 邮件 stub 服务 ├── 每个场景真实调 API ,真实查库 ├── 邮件 stub 捕获验证链接,自动"点击" └── 断言数据库状态 + API 返回值 + 邮件发送记录 ``` |
20
dongzhuo777 4 小时 26 分钟前
羡慕能本地编译跑通测试的产品和开发模式。
|
21
ooee2016 4 小时 24 分钟前
大致认同这个观点, 但是一个功能 20 分钟有点过分了
|
22
JYii 4 小时 16 分钟前
@dodoa #18 所以 AI 测试基本上跟 AI 编程已经可以切割成两块了。
就你所举得例子,测试端需要的设计和 token 超出编码阶段。 在今天这个时间点,计划、实现、测试、debug 、部署还挺难。 |
23
wsseo 4 小时 15 分钟前 马斯克也没用过呢
|
24
HappyAndSmile 4 小时 15 分钟前
@outman87 真的吗?那开中间的几百块人民币一个月的那个套餐够用吗
|
25
shinelamla 4 小时 9 分钟前
看完了之后只知道了你的工作流有什么组成部份,但是没有明白具体是怎么样玩得更转的,有具体的例子吗?看着文章是有点布道向的,希望能请教下是怎么将这些东西组合在一起运转的工作流案例 @dodoa
|
26
liuhuihao 4 小时 8 分钟前
作为前端,设计图还原度还有复杂业务(我们这边是定制化的富文本/内容编辑器)AI 还搞不定。
设计图也接了 mcp ,但是要想还原度高还必须得设计师配合,搞好各种图层叠加之类的,现在的设计图 ai 写出来只能说能看,但是不是所有的项目都只是达到“能看”的水平就够的。 富文本编辑器内部的深度定制之类的,ai 搞得也够呛,一堆问题 |
27
layxy 4 小时 7 分钟前
gpt5.4 + agents + skills + mcp 也很强,其他体感不弱于 opus4.6
|
28
Haku 4 小时 7 分钟前
问问配置,Agent 用的啥?
另外 AI 测试感觉不是一般的难。 |
29
mosesyou 4 小时 6 分钟前
mcp 已经逐渐被淘汰了,我全转 skill+script 了
|
30
dodoa OP |
31
NoobNoob030 4 小时 3 分钟前
opus4.6 贵 + ccmax 封号 + anthropic ceo 反华先锋被信创命令禁止
|
32
strobber16 4 小时 3 分钟前 得加钱
|
33
xloger 3 小时 57 分钟前
那我都用过了还是觉得它有局限。
一般来说是用 Sonnet 4.6 ,Cursor ,SuperPowers 的脑暴,Figma 的 MCP 之类的。 AI 的提升是很大,尤其是新写一些独立的功能时,几乎不咋改或者说说就能优化好。基本就是当我构思好怎么写,让它帮我完成敲代码这件事。 这部分是我觉得 AI 提升最大的,而且会少很多写代码的疲惫感。 但是,一旦是涉及到旧代码重构,或者跟旧代码交互时,它的体现往往会让我很恼火。 比如我发现有两块代码(不同同事写的,在的模块不一样)的逻辑是基本一致的,让它重构整合一下。 效果是惨不忍睹的。它往往都是强行从代码的角度复用了代码,并没有从逻辑上进行分层整理。能跑么,能跑;效果对么,对。但实际上改了不如不改,更耦合难懂了。 这类情况不是第一次发生了。 越这样最后越扑朔迷离难以维护。(虽然人类同事也一样会写屎山) AI 在我看来,它是一个能让你省事的工具,但它不是一个能帮你省心的工具。 如果自己连思考都交给 AI 了,那这个项目对你来说已经是“失控”的了。反过来说,那这个“你写的”AI 项目跟“别人写的”AI 项目有什么优势呢,那为什么要用“你写的”呢。 |
34
catazshadow 3 小时 56 分钟前
能用 AI 搞定的项目说明这项目本身也不是什么大不了的东西,重复训练材料里有的东西而已
|
35
DiamondYuan 3 小时 55 分钟前
|
37
xingchenxf 3 小时 51 分钟前
楼主能分享一下你用的是哪个 ide 吗? CC 、Codex 、Gemini CLI 、curcor 、Antigravity ?
用了哪些 skills 、mcp ? 或者有没有工程配置文件,直接发出来?我也想试试。 |
38
wyntalgeer 3 小时 44 分钟前
@bigxixi 调不了一点,这种场景不要有任何指望。我们的 Android 真机疑难杂症也调不了,真机这一块,如果人类专家都感觉棘手的问题就不用找 AI 浪费时间了,你连构造 Prompts 都没法满意
|
39
limbo0 3 小时 39 分钟前
@xingchenxf #37 cli 里直接对话就够了
|
41
codehz 3 小时 35 分钟前
真机调试这块,其实安卓可以连 adb 自己截图+模拟按键调试的,,这事 cc 真的是可以干,流程跑通之后直接整合成 skill ,就完事了
|
42
r6cb 3 小时 30 分钟前
帖子的 ai 味有点重
|
43
woodfizky 3 小时 30 分钟前
"""
我现在的工作流大概是这样: 我是项目经理,AI 是干活的工程师团队。 """ 那我问你,你的项目,开发测试阶段都很成功,项目上线了。 实际投产出 bug/故障了,因为代码都是 AI 写的,如果你只是个项目经理,DEBUG 能力不足的情况,如何排除故障? 注意这个项目上线前测试用例都通过了。 你要知道有些复杂业务,业务数据逻辑理解不足的情况,程序逻辑设计很有可能出现: 短期内没事,上线数据量大了或者产生脏数据之后才会出问题 这种情况。 |
44
Clannad0708 3 小时 28 分钟前
|
45
ZhuZhuQianJin 3 小时 28 分钟前
看了上面的回复,感觉客户端的验证就是截个图,看看 UI 和设计图一样不一样,按钮能不能点,这点功能了。
|
46
miusmile 3 小时 20 分钟前
我理解 op 的意思,目前也在慢慢向这个路线靠拢,也体验到了 AI 的强大。但是正如 op 所说,AI 是需要调教的。我想知道 op 都搭配了哪些 skills ,mcp ,plugins 。或者有什么经验分享的,真心求问
|
47
lenglengyuchen 3 小时 8 分钟前 via Android
好奇一个中等复杂度的功能具体是啥,20 分钟从开始做到 merge 是否有些夸张了
|
48
find 3 小时 8 分钟前 via Android
赞同,但是冒昧的问一句,你的收入增加了,做这些的目的是为了爱吗?
|
49
jqknono 3 小时 4 分钟前
gpt5 系列模型不需要这些花活
|
50
lujiaosama 3 小时 2 分钟前
codex 也不差.mcp 基本没啥用了, 除了 playwright 这种.
|
51
lesismal 3 小时 0 分钟前
说明 OP 只是普通用户罢了,没什么可自傲的,更没必要五十步笑百步。
硅谷大佬炮轰 MCP:简直烂透了! 开发者们集体叛逃拆除 MCP ,转向 CLI 、Skills ! 250 倍性能差距!最好的协议,是没有协议! https://finance.sina.com.cn/wm/2026-03-15/doc-inhqzuxz0128772.shtml Perplexity 放弃了 MCP ,Cloudflare 解释了为什么调用 MCP 的工具对人工智能代理的效果不好 https://www.reddit.com/r/developpeurs/comments/1rrt2af/perplexity_l%C3%A2che_les_mcp_cloudflare_explique/?tl=zh-hans |
52
jaoyina 2 小时 59 分钟前 via Android
大家工作中用是公司付钱还是自己买啊?
|
53
dajj 2 小时 55 分钟前
我用哥迷你,怪不得我觉得 ai 不行。
但是这个流程,感觉上班更累了, 轻松得活全让 ai 干了,剩下都是难的活。 |
54
v2exgo 2 小时 54 分钟前 昨天被封了 100 多个 MAX 号,现在只剩逆向了,https://terminal.pub 老铁们支持一下
|
56
Bad0Guy 2 小时 50 分钟前 via iPhone
不如说 Openclaw 就是个玩具,并且 opus4.6 也不是百分百的强,有些活 GPT 经验比 Claude 多,知道该怎么处理
|
57
lesismal 2 小时 49 分钟前
@boboaiya3 是的,AI 的迭代/进化速度,当下的工具或者方法可能很快就会过时,即使不过时,也可以自己不用细学、直接关键字问 AI 去做就行,甚至关键字也可以问 AI ,让 AI 自己递归/自举。
|
58
lesismal 2 小时 45 分钟前
@boboaiya3 用 AI ,需要文科能力加强。以前学好数理化走遍全天下,以后文科反倒可能在这些领域实现反超。因为当下已经有几个案例、AI 甚至可以在顶尖数学领域快速解决人类顶尖数学家解决不了的难题。未来 AI 更强了,人更需要的是提出想法、详细描述。
想想曾经的一些程序员同事,具备凑合的代码能力,但连个问题都讲不清楚,真的让人捉急。 热搜! AI 大厂月薪 3 万疯抢文科生? https://finance.sina.com.cn/wm/2026-03-17/doc-inhrieih5243114.shtml |
59
HHHans 2 小时 43 分钟前
codex 用户实名反对。
|
60
jarryli 2 小时 41 分钟前
基本上赞同楼主观念,虽然有点极端,但整体没错。
AI 编程一定要用 Claude Code 或 Codex 、OpenClaw ,大模型选 Opus4.6 或 GPT5.3-Codex ,再加上 Skills 和一些工具。这个模式目前正在普及,估计 2-3 年就全面流行开来了。 一点看法《 AI 时代,人人都是 Agent 工程师》: https://github.com/microwind/algorithms/blob/main/start-here/AI-Era-Programmers-as-Agent-Engineers.md |
61
coderlxm 2 小时 34 分钟前 via iPhone
a 畜封号人人喊打,也没拉开 gpt5.4 多少差距,闹麻了
|
62
iv2ex 2 小时 30 分钟前
那你来说说 agents 、skills 、mcp 之间的区别和关系
|
64
felixcode 2 小时 28 分钟前
把这些流行的词攒一块说,显得好厉害啊!
|
65
lwjlee 2 小时 22 分钟前 via Android
没用过人生不完整。有 GitHub Copilot Business 车位,可以用 Opus 4.6
|
66
dsd2077 PRO 来点干货呀!好用的 skill 和 MCP 掏出来,这样大家就不会说啥了。
|
67
justdoitzZ 2 小时 17 分钟前
说真的,我想给 claude code 付费了。同样一份带表格和折线图的英文扫描 pdf,25 页,我都给网页版 cluade.只花了不超过 3 分钟,自己决定方案 md+latex ,获取了全部细节和数值,表格。
丢给 codex ,team 版本,等了 10 分钟,第一个版本都是乱码。ok ,把 claude 的转换方案提取出来,继续让 codex 按照这个方案来搞,继续等待 10 分钟,做出来的东西还是垃圾,没法用。对了是用的 codex5.4+extra high 。 可见 claude 牛逼。 cursor 感觉现在变得很贵了,反而免费的 claude 成了生产力工具了。 真心求教,怎么正常付费购买 claude.公司批准采购了,但是没有发票,也没找到靠谱的代理公司 |
68
fzzff 2 小时 9 分钟前
非常认可, 现在程序员正在两极分化, 据我观察现在还是有相当一部分人排斥 ai 编程, 以前还会苦口婆心的劝说以下, 现在只能说尊重他人命运
|
69
MacsedProtoss 2 小时 6 分钟前 via iPhone
几万行的工程算个 P 啊… 这也叫大工程?有点搞笑
|
70
yucao 1 小时 59 分钟前
我们公司几百万行也上的大工程也是丢给 Claude Opus 4.6 ,出需求,丢进去然后实现,再加上人 Review 和测试,提效非常明显
的确有没有用过 Opus 4.6 的,已经是两个时代的开发者了 |
71
youshangdemajia 1 小时 58 分钟前
看上去是实现一个新项目才能用的工作流,对于复杂的屎山代码几乎没什么作用。我不知道这种实现一个新项目的场景有多少,但我相信对很多人的工作,大部分时间都在维护一些陈年老项目,AI 这时候的作用没那么大,很多时候还是要自己上手写。
而且 AI 也不是万能的,一些复杂的功能,假如它没怎么见过,大概率会陷入细节无法自拔,泛化失效。 我现在就是陷入了这种困境,AI 针对某个算法问题随便吐出一千多行代码,我压根看不过来。结果一直不对,我只能不断对话许愿,代码屎山也在不断堆高。这时候还是要细致的人工介入。 我用的是 Opus 4.6 + Codex 5.4 + Gemini 3.1 |
72
godspeedyou 1 小时 51 分钟前
我寻思这些也不是什么新概念吧,op 是最近刚接触吗
|
73
godspeedyou 1 小时 46 分钟前
|
74
EthanV2 1 小时 39 分钟前
牛逼,你这个帖子应该是动态的,反正 ai 的新词多了,等下一个阶段,你这个帖子又能增加了,没用 xx ,是不足以谈 xx 的。球球你,去赚钱吧,发帖做什么啊,少爷
|
75
aureole999 1 小时 38 分钟前
@mosesyou 我不太懂,比如 jira mcp 怎么用 skill 取代?
|
76
loryyang 1 小时 25 分钟前
其实还是那句老话,talk is cheap, show me the code
对应到这里,就是,给我一个不管是谁的实际工作的案例,要求不是 demo ,连续用 AI 完成 10+需求 据我个人观察,目前还没有,我司内部,也是轰轰烈烈,但所有的经验总结,依然还是要做好 ABCDEF ,才能让 AI 写好代码,但里面的 DEF 可不容易实现 我自己过年回来也是深度使用 cc ,当然我用不起 opus4.6 ,还在用 kimi ,目前结论: 1. 提效有,但依然强依赖人的经验,人的投入依然不少(核心在 plan 阶段和 review 阶段)。那些号称牛逼的 SDD 插件( plugin )、skill ,比如 specKit ,superPower ,有用,但不是银弹 2. 非专业的人,绝对不可能用 AI 独立完成产品开发,一个 bug ,AI 半天修不好是很常见的 当然大模型发展也很快,也许不远的将来,能实现完全自主编程,但绝对不是现在 |
77
v2exgo 1 小时 15 分钟前
@justdoitzZ 找我 https://terminal.pub/register 我能开票
|
78
7beloved 1 小时 11 分钟前
你其实和你喷的人一样傲慢
|
79
rokcy 1 小时 10 分钟前
现在 gpt5.4 和 opus4.6 没啥太大差距了,而且额度多很多,可以考虑组合使用
|
82
taotaodaddy 1 小时 7 分钟前
大差不差,但 codex + gpt5.4xhigh 也很强
|
84
nrtEBH 1 小时 5 分钟前
每次新的技术热点出来都会有人自以为清醒 你又何必理会
闷声发大财 才是最吼的 |
86
Lemonadeccc 1 小时 5 分钟前
不懂就问这个 agents 指的是 subagents 多 worktree 改代码么
|
88
funnyecho 59 分钟前
基本上是同意 op 观点的
|
89
Plutooo 54 分钟前
没那么神,大概有你说的 70-80%的程度吧,个人干劲儿还是人的专注力比较难平衡,假设一天做 5 个功能,如果 ai 实现 review 后有些偏差需要调试的话我会精神恍惚
|
90
JackeyLee233 50 分钟前
不懂就问 楼主是怎么用 opus4.6 的呢 怎样发挥它的最大价值 是直接在网页对话吗?还是集成到什么工具里?我也开它家会员了 目前就是网页用 cowork 体验了下 又配在了 OpenClaw 上用
|
91
qiyilai 48 分钟前
1 、不熟悉领域快速上手
2 、接手之前项目理清业务逻辑 3 、日常工作提效 这三点确实不可否认,工作岗位绝对会减少,减少的比例就看公司对于 ai 的开发和利用率了 |
92
gogogo1203 47 分钟前
‘3. Skills 是经验
你可以把特定领域的最佳实践、项目规范、工具使用方法封装成 skill 喂给 agent 。相当于这个"工程师"入职的时候就已经读完了所有内部文档。不用你每次都从头教。’ ------------- skill 不仅仅是一个.md , 它可以包含可执行的程序。也就是说 CC 调用到这个 skill 的时候,按照 md 描述的步骤干活。可以是把指定音频用 py 丢给第三方 api, 等待结果返回,校验,使用结果,插入都某个页面,某个 div. 如果你没有弄明白 skill 的边界,下次还是用一个比较委婉的标题吧. |
93
0xC000009F 42 分钟前
@liu731 把 WPS 换成记事本
|
94
prime2015 37 分钟前
我建议各位老哥对于 ai 编程,用尽管用,但是要偷摸的用,别特么用了之后到处宣传,还显码农这一行死得不够快是吗
|
95
dodoa OP @rokcy #79 开了个 20 刀的 gpt 作为备用,这周先用完的是 gpt ,但比较良心一点的是他的 app 能用 codex api token 被限额不能用了。
|
96
oom 10 分钟前
MCP 刚被 Anthropic 推出时,花了 3 个月时间在公司内部开发了 MCP+多智能体调度也接入了知识库,完事后 Anthropic 又推出了 SKILLS ,瞬间感觉自己就像小丑一样,现在这个功能已经是路边一条
|