• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dsd2077
V2EX  ›  程序员

vibe-coding 一时爽,一直 vibe-coding 呢?

  •  1
     
  •   dsd2077 ·
    PRO
    ·
    dsd2077 · 12h 36m ago · 2086 views

    昨天碰到一个音画不同步问题(数字人说话时一旦声音和画面出现了细微的偏差,整个视频看起来就非常奇怪,嘴型对不上),恁是 vibe 了一整天都没解决。有时候通过 vibe coding 来解决问题,就像是在抽盲盒。由于音视频开发的细节太多,导致 AI 没办法很细致地解决延迟、同步问题。这咋整呢?要么就自己一行一行地去看代码、梳理逻辑,要么就继续 vibe coding 碰概率。而且我发现 vibe coding 到最后真的什么都学不到,没有任何技术上的成长。唯一的收获可能就是做出了一个产品,或者实现了某一个功能。如果将来 AI 能够短时间变得更聪明倒还好,这样大家也不用再关心技术问题了。如果没有的话,或者像自动驾驶从 L2 到 L4 这么缓慢进步,一直 vibe coding 是一件对职业发展很不利的事情,长期如此技术成长基本上就停滞了。所以我觉得现阶段还是非常有必要去搞清楚技术原理,理解架构。并在此基础上去用 AI 来加速开发,而不是一直 vibe coding 下去,什么都不管。如果只是写一个网页、一个插件或者一个简单的 app 或者快速出原型,倒是无关紧要。但如果是像 CyberVerse 这样想要持续更新的项目,这种方式一定是不可持续的,欠下的技术债,终有一天要还。今天开始认真地研究代码、研究逻辑,把 bug 找出来。

    19 replies    2026-05-24 19:13:44 +08:00
    teaguexiao
        1
    teaguexiao  
       12h 14m ago   ❤️ 2
    同感,vibe coding 出原型、验证想法超爽,但遇到音视频同步这类底层问题,不懂原理就真的只能靠抽卡。我现在的方式是先把核心链路的代码读懂,理解了再让 AI 来加速,这样出了 bug 至少知道往哪查。
    FH0
        2
    FH0  
       11h 54m ago
    如果问题有复现方法的话那应该是能解决的。

    我之前遇到过一个音频的问题,是一个 HDMI IN -> I2S+MIPI -> PCM+HEVC -> MAC -> MAC -> PCM+HEVC -> I2S+HDMI -> HDMI OUT 的项目中,关键是如何量化问题。

    我遇到的问题是声音听着时不时有一点“细小的爆破音”,但这个东西和 AI 说它是不懂的,用 Audacity 和 AI 一起研究了很久,发现是波形频率突变导致人耳听到了异常的声音,然后让 AI 自己定位这个突变是从哪个环节产生的就好了。
    Allendeng
        3
    Allendeng  
       11h 51m ago   ❤️ 1
    一直爽
    lujiaosama
        4
    lujiaosama  
       11h 49m ago
    这个抽卡的体验让我想起了 Claude 3.7 的时候,AI 不够聪明,就是靠一遍一遍的重复推倒来逼近想要的结果。抽了一天最后发现完全不可用的时候那个挫败感,空虚感太强烈了。在完全不懂的领域里纯靠 AI CODING,出点小 BUG 都没有信心能快速定位进行修改。
    kujo
        5
    kujo  
       11h 47m ago
    屎山比人堆的快多了,崩盘的概率变大
    s3040608090
        6
    s3040608090  
       11h 36m ago
    这种时候我一般会先尽可能告诉模型问题的复现逻辑(或者可能无法精准复现),然后告诉模型,在你觉得可能的地方打 log ,我把看到的告诉你。一般两三轮下来就解决了。
    otakustay
        7
    otakustay  
       11h 15m ago
    你有架起来让 Agent 自己能够去“看”视频确定是不是同步的系统吗,有的话你应该任务放在那,说明白几分几秒是典型的不同步,要彻底解决且采样其它位置也要同步,直接证 Agent 自己干就好了
    ebushicao
        8
    ebushicao  
       10h 47m ago   ❤️ 1
    你没理解 vibe coding 也是一门技术,很多时候你 vibe 无法解决是因为你 vibe 方面的技术不行,不是你应该回归古法编程。你什么都学不到也没有任何技术上的成长是因为你就没认真对待 vibe coding ,潜意识觉得 vibe coding 就是写点提示词把什么都交给 AI 做。

    你觉得现阶段有必要去搞清楚技术原理和理解架构,说明你觉得 vibe coding 不需要搞清楚,但这明显是错的,恰恰 vibe coding 更需要搞清楚技术原理和理解架构,而且 vibe coding 让你有更多的时间可以搞清楚。
    dsd2077
        9
    dsd2077  
    OP
    PRO
       10h 46m ago via Android
    @otakustay 有的,我用 codex computer use 搭了一套完整的端到端测试框架。但是不得行,因为音画不同步是非常细微的问题,可能就差几十毫秒。而且也不是每次都有,AI 根本捕捉不到
    所以我觉得我差一套链路监控方案,今天试试
    otakustay
        10
    otakustay  
       10h 10m ago
    @dsd2077 不能稳定复现、不能高效观测(比如非得肉眼看视频,不能从音轨和时间帧上看)那就麻烦了,人来做也挺麻烦的……
    rick13
        11
    rick13  
       7h 45m ago
    我完全不会 ios 开发,刚指挥 codex 做了一个简单的数据运动输出导出的功能,我确实什么都没学到,但问题是我也不想学 ios 开发
    zhangleijuly
        12
    zhangleijuly  
       7h 45m ago
    其实你的情况不就是个反例吗,vibe coding 能够帮很多人开发自己原本写不了的代码,但是 vibe coding 遇到解决不了的问题的时候就需要人知道解决方法指导 AI 去做才行。最后你自己去研究代码和逻辑也说明了我们仍然需要关注技术问题,只不过更多需要关注 AI 解决不了或者解决不好的问题。
    xiaomushen
        13
    xiaomushen  
       6h 50m ago
    隔一个月要停一天,手工清理对齐一下
    someonelikeyouah
        14
    someonelikeyouah  
       6h 50m ago
    感觉也没必要去 完全读懂源代码,只是我的个人看法,有的时候训练自己收缩问题的能力也是非常好的,当然了读懂源码是第一性原理对吧,这本身也是个收缩过程,如果可以把问题一步步压缩 其实 llm 也能帮你找出问题(再强调一遍,我是猜的,我没遇到过这么高端的东西
    zainJJ
        15
    zainJJ  
       6h 31m ago
    我觉得 8 楼很对,vibe coding 是很重要的翻译技术。 对我来说就是把需求翻译给 ai ,越详细越能接近需求,理解架构原理也是为了能翻译的更准确,出现的问题能描述的更清楚
    dsd2077
        16
    dsd2077  
    OP
    PRO
       5h 20m ago via Android
    @xiaomushen 好建议
    dsd2077
        17
    dsd2077  
    OP
    PRO
       5h 18m ago via Android
    @zhangleijuly 嗯,是这样的。关注解决不了的问题。
    dsd2077
        18
    dsd2077  
    OP
    PRO
       5h 17m ago via Android
    @rick13 前期不用学,快速出 demo 是对的。
    davidqw
        19
    davidqw  
       5h 10m ago
    一直爽啊,之前遇到音视频不同步,agent 发现 aac 不行,要转为 wav 后才可以逐帧调整不会多出几十 ms ,自己发现后就把格式给转了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1602 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 81ms · UTC 16:24 · PVG 00:24 · LAX 09:24 · JFK 12:24
    ♥ Do have faith in what you're doing.