V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
baby0w0
V2EX  ›  程序员

最近在研究 ai 变声 太爽了

  •  4
     
  •   baby0w0 · 2025 年 12 月 30 日 · 30126 次点击
    这是一个创建于 83 天前的主题,其中的信息可能已经有所发展或是发生改变。
    打游戏 全是舔狗

    目前两台电脑 一台推理 一台打游戏. 副机推理的声音作为主机的麦克风输入
    完美解决了 1 个显卡压力太大的问题
    第 1 条附言  ·  2025 年 12 月 30 日
    晚点我有空出一个视频吧,给大家看看效果.
    第 2 条附言  ·  2025 年 12 月 30 日
    aHR0cHM6Ly9iMjMudHYvQ0JiNGRteg==

    b 站视频
    第 3 条附言  ·  1 月 5 日
    有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就把视频删了
    第 4 条附言  ·  1 月 5 日
    比如怎么做一个番茄鸡蛋汤. 说了 需要用到 锅 铲子 水 鸡蛋 番茄 盐 等调料.
    然后呢 有些人呢 就会让你把详细的步骤写出来, 还问你 你用的鸡蛋是什么品种 番茄是什么品种

    1. 给他分享了 还嫌弃说你藏私, 开火都不会的人 就纠结上食材品种了?
    2. 我没那么多时间手把手教, 我原先视频中给了几个关键词,github 上的 readme 有完整的步骤



    这种人太多了,综上所述,我删除了视频
    第 5 条附言  ·  1 月 9 日
    最近也有点感悟吧,这个东西我感觉坏处大于好处,就我自己来说, 我现在每天的饮料 奶茶 甚至吃饭都有不同的人 和相同的人给我点.
    这种小钱弄多了 我觉得也不太好是吧,虽然我也付出了时间和别人一起玩.
    但是呢 这个东西我觉得我还是不要传播了,避免有心人拿去骗钱.骗大钱.这是大忌, 关键词在回复中我已经说了
    大家可以去搜 github. 我这里不做传播了.
    245 条回复    2026-03-07 13:49:08 +08:00
    1  2  3  
    andy101wong
        201
    andy101wong  
       1 月 2 日
    大佬你这双机方案延迟控制的太顶了 我也想搞搞延迟低的 哪个具体开源项目值得试试啊
    sickick
        202
    sickick  
       1 月 2 日
    程序员论坛到最后也是秀一手不公开项目地址
    qiuyue0
        203
    qiuyue0  
       1 月 2 日
    坐等教程
    Leon6868
        204
    Leon6868  
       1 月 3 日
    東雪蓮的声音是吧
    hentailolicon
        205
    hentailolicon  
       1 月 3 日
    一边回复不是 rvc 一边视频说 rvc 纯低能浪费大家时间
    baby0w0
        206
    baby0w0  
    OP
       1 月 4 日
    @sickick 视频里已经说了
    baby0w0
        207
    baby0w0  
    OP
       1 月 4 日
    @hentailolicon 可惜你连 rvc 都没弄清楚,如果你弄清楚了就不会纠结是不是 r v c
    baby0w0
        208
    baby0w0  
    OP
       1 月 4 日
    @hentailolicon 比如连 java 基础语法都不会的人,已经开始想知道怎么用 java 操作数据库了, 这才是纯低能。
    balaWgc
        209
    balaWgc  
       1 月 4 日
    视频怎么不见了
    baby0w0
        210
    baby0w0  
    OP
       1 月 4 日
    @balaWgc 有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就删了.
    youyoumarco
        211
    youyoumarco  
       1 月 4 日
    视频被抬了吗?
    baby0w0
        212
    baby0w0  
    OP
       1 月 4 日
    @youyoumarco 有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就删了
    Grooveys
        213
    Grooveys  
       1 月 4 日
    楼主求留个网盘地址~我想学习一下,感谢感谢
    johnsonxie83
        214
    johnsonxie83  
       1 月 4 日
    楼主能不能私下分享一下,很想学习一下,感谢感谢
    d1572862827
        215
    d1572862827  
       1 月 4 日
    大佬求一个视频教程哇~
    ulpyxua
        216
    ulpyxua  
       1 月 4 日
    视频不见了。
    haipenglisvillt
        217
    haipenglisvillt  
       1 月 4 日
    b 站视频过期了,重新发一个昂
    haipenglisvillt
        218
    haipenglisvillt  
       1 月 4 日
    @baby0w0 楼主大大,给个视频,膜拜一下
    xp
        219
    xp  
       1 月 4 日
    用的啥模型
    xp
        220
    xp  
       1 月 4 日
    用得啥模型
    kenvix
        221
    kenvix  
       1 月 5 日
    @Kasine #91 有实际收益的。
    搜打撤类游戏,你在后面什么也不干就摸鱼,然后大哥打完架了你开变声器请求大哥让你舔包
    啥也不干就狂赚了属于是
    5waker
        222
    5waker  
       1 月 5 日
    @baby0w0 雅美喽,我还在等你的视频学习,怎么突然下架了。求私
    NakanoAzure
        223
    NakanoAzure  
       1 月 5 日
    曼波变声器怎么弄啊,好像也没搜到开源的
    f11st1
        224
    f11st1  
       1 月 5 日
    不愿意分享就别发出来哗众取宠,方案在愿意折腾的人手里也不是搞不出来
    baby0w0
        225
    baby0w0  
    OP
       1 月 5 日
    @f11st1 就是因为你这样的人太多了, 我才把视频删除了.
    5waker
        226
    5waker  
       1 月 5 日
    @baby0w0 分享别看差评,要看好评
    byranb
        227
    byranb  
       1 月 5 日
    内射了吗
    liranvv
        228
    liranvv  
       1 月 5 日
    蹲个楼主分享
    Mast
        229
    Mast  
       1 月 6 日
    一看 OP 就是年轻人,受不了一点压力,哈哈,你这种心态就不要放出来,以免自己心态爆炸。
    d1572862827
        230
    d1572862827  
       1 月 6 日
    @baby0w0 楼主还是很希望可以学习下的...可以给个关键词什么的也可以啊
    ota
        231
    ota  
       1 月 6 日
    @f11st1 主要是标题党,ta 这个标题先把 ai 变身 这个热门关键字加点权重,然后内容端用 主从分离 这个关键字来让大家觉得 op 主的确有做 process 的解构。看得出偏向落地实操。
    其实把。就是整合而已。也根本不用两台机器。用虚拟声卡,类似 Voicemeeter 即可,单机性能够强的情况下,做主从会增加不少网络 jitter ,我没实测过,但起码+15ms 以上。
    第二点,ai 变声推理其实并不怎么吃显卡。所以单机即可。大部分变声模型,比如 rvc svc 这些,你 rtx 20 系列都能很顺利的跑起来,而且占用通常 5-15%。既然不占用游戏帧率,所以 op 主的这套分离意义并不大。毕竟 op 也说了,主要是吸引添狗用的。

    但凡不是同时要跑 vtuber 之类的虚拟 avatar 这种应用,游戏+变身其实没那么复杂。

    还有,op 主不想分享是其自由,人家只想听好话,想被认可想受到正向赞美,这是可以理解的。毕竟新手都有这样的过程,v2 的老人们是不是稍微对新人有点苛刻了?

    我觉得技术落地,探讨,最好还是 reddit 或者 note 这类平台比较好。都是很正向的分享,投稿人的素养也是 ok 的。

    总结:op 给了思路,其实已经 ok 了。具体流程我们真的不要太纠结。
    d1572862827
        232
    d1572862827  
       1 月 6 日
    @ota 可以咨询下思路什么的吗....或者 github 地址也可以...之前 up 的视频没看到
    ota
        233
    ota  
       1 月 7 日
    @d1572862827 Voicemeeter 拿来做音频路由,免费版就行了,有钱上个 potato 也不贵。
    ai 变声器自己找一个跑就好,大多数是 RVC 。训练好的模型也有很多,我主要混日系的,国内不太清楚。比如这个:
    https://chihaya369.booth.pm/items/4701666 可以参考参考。其实还算自然。没有太多噪点。
    但要减少 lag 硬件配置和音频路由方面要设置好,一般 30ms 左右其实你已经不会感觉不同步的了。基本 wdm 就已经够用了,你用 asio 则能更进一步降低延迟。
    baby0w0
        234
    baby0w0  
    OP
       1 月 7 日
    @ota 不知道你用过 rvc 没,首先游戏不锁帧的话 rvc 必然卡机关枪, 哪怕你是 5090.
    baby0w0
        235
    baby0w0  
    OP
       1 月 7 日
    @ota 第二 有的游戏安全强制检测,你过不去这个检测. 游戏和你的软件无法同时运行
    baby0w0
        236
    baby0w0  
    OP
       1 月 7 日
    @ota 第三 双机走的说硬件通道,不是网络传输.不存在任何延迟,
    baby0w0
        237
    baby0w0  
    OP
       1 月 7 日
    @ota 第四 模型要找人去录音棚录 8 个小时以上中英文,包含笑哭等 日系模型说中文 那就是一耳变声器的感觉.
    ota
        238
    ota  
       1 月 7 日   ❤️ 1
    @baby0w0
    >不知道你用过 rvc 没,首先游戏不锁帧的话 rvc 必然卡机关枪, 哪怕你是 5090.
    这的确,游戏不锁帧就会 gpu 占满导致推理排队。主要还是调度问题。可以解决,小问题。

    >第二 有的游戏安全强制检测,你过不去这个检测. 游戏和你的软件无法同时运行
    反作弊机制我倒没考虑过,因为我不玩游戏,不太了解。这应该就是你需要主从的根本原因了把。不然 rvc +Voicemeeter 没啥问题的。因为我经常看 vtuber 的实现,基本都是这样的方案。但游戏我不玩也不看直播等,所以还真不了解,盲区。

    >第三 双机走的说硬件通道,不是网络传输.不存在任何延迟。
    延迟部分只能说没那么讲究,低于 30ms 就已经无法察觉延迟了。推理的 15ms 是必须的。硬件接入=0 ,虚拟声卡路由一般也能控制在 5-15ms 。

    >第四 模型要找人去录音棚录 8 个小时以上中英文,包含笑哭等 日系模型说中文 那就是一耳变声器的感觉.
    我只是抛砖引玉,可不是说拿日系的来说中文,中文系中没有公开分享的模型吗?如果你的确需要定制化,那我们说的也是一类东西,我是习惯开箱即用,你是自己调教模型。

    @d1572862827
    op 主把思路又整理了下。结论是游戏直播的话,你必须做物理隔绝,甚至 pve 这类虚拟化也不行,因为有反作弊检查。主要是这个导致了主从分离,延迟其实并不是核心问题。
    c466934322
        239
    c466934322  
       1 月 7 日
    技术栈呢,老哥
    d1572862827
        240
    d1572862827  
       1 月 7 日
    @ota 感谢感谢
    d1572862827
        241
    d1572862827  
       1 月 7 日
    @baby0w0 op 真的不在放出视频教程了吗......天天来蹲好几天了...临时网盘链接也可以
    HuPu
        242
    HuPu  
       1 月 9 日 via Android
    楼主你好 我对这个非常感兴趣 想愿意付费咨询 300 元/小时 如果您感兴趣可以加我吗?谢谢
    d29zaGlyZW56eg==
    ffw5b7
        243
    ffw5b7  
       1 月 14 日
    哪里可以获取到语音数据集?有偿购买也许
    baby0w0
        244
    baby0w0  
    OP
       1 月 15 日
    @ffw5b7 你花钱找人帮你录
    CivAx
        245
    CivAx  
       16 天前
    @baby0w0 #187 你好像挺自豪的,那祝你新婚 femboy pegging 吧。
    1  2  3  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2798 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 15:43 · PVG 23:43 · LAX 08:43 · JFK 11:43
    ♥ Do have faith in what you're doing.