V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
baby0w0
V2EX  ›  程序员

最近在研究 ai 变声 太爽了

  •  4
     
  •   baby0w0 · 2025 年 12 月 30 日 · 28000 次点击
    打游戏 全是舔狗

    目前两台电脑 一台推理 一台打游戏. 副机推理的声音作为主机的麦克风输入
    完美解决了 1 个显卡压力太大的问题
    第 1 条附言  ·  2025 年 12 月 30 日
    晚点我有空出一个视频吧,给大家看看效果.
    第 2 条附言  ·  2025 年 12 月 30 日
    aHR0cHM6Ly9iMjMudHYvQ0JiNGRteg==

    b 站视频
    第 3 条附言  ·  14 天前
    有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就把视频删了
    第 4 条附言  ·  14 天前
    比如怎么做一个番茄鸡蛋汤. 说了 需要用到 锅 铲子 水 鸡蛋 番茄 盐 等调料.
    然后呢 有些人呢 就会让你把详细的步骤写出来, 还问你 你用的鸡蛋是什么品种 番茄是什么品种

    1. 给他分享了 还嫌弃说你藏私, 开火都不会的人 就纠结上食材品种了?
    2. 我没那么多时间手把手教, 我原先视频中给了几个关键词,github 上的 readme 有完整的步骤



    这种人太多了,综上所述,我删除了视频
    第 5 条附言  ·  10 天前
    最近也有点感悟吧,这个东西我感觉坏处大于好处,就我自己来说, 我现在每天的饮料 奶茶 甚至吃饭都有不同的人 和相同的人给我点.
    这种小钱弄多了 我觉得也不太好是吧,虽然我也付出了时间和别人一起玩.
    但是呢 这个东西我觉得我还是不要传播了,避免有心人拿去骗钱.骗大钱.这是大忌, 关键词在回复中我已经说了
    大家可以去搜 github. 我这里不做传播了.
    244 条回复    2026-01-15 09:15:49 +08:00
    1  2  3  
    andy101wong
        201
    andy101wong  
       17 天前
    大佬你这双机方案延迟控制的太顶了 我也想搞搞延迟低的 哪个具体开源项目值得试试啊
    sickick
        202
    sickick  
       17 天前
    程序员论坛到最后也是秀一手不公开项目地址
    qiuyue0
        203
    qiuyue0  
       17 天前
    坐等教程
    Leon6868
        204
    Leon6868  
       16 天前
    東雪蓮的声音是吧
    hentailolicon
        205
    hentailolicon  
       16 天前
    一边回复不是 rvc 一边视频说 rvc 纯低能浪费大家时间
    baby0w0
        206
    baby0w0  
    OP
       15 天前
    @sickick 视频里已经说了
    baby0w0
        207
    baby0w0  
    OP
       15 天前
    @hentailolicon 可惜你连 rvc 都没弄清楚,如果你弄清楚了就不会纠结是不是 r v c
    baby0w0
        208
    baby0w0  
    OP
       15 天前
    @hentailolicon 比如连 java 基础语法都不会的人,已经开始想知道怎么用 java 操作数据库了, 这才是纯低能。
    balaWgc
        209
    balaWgc  
       15 天前
    视频怎么不见了
    baby0w0
        210
    baby0w0  
    OP
       15 天前
    @balaWgc 有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就删了.
    youyoumarco
        211
    youyoumarco  
       15 天前
    视频被抬了吗?
    baby0w0
        212
    baby0w0  
    OP
       15 天前
    @youyoumarco 有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
    这样的人有点多 我就删了
    Grooveys
        213
    Grooveys  
       15 天前
    楼主求留个网盘地址~我想学习一下,感谢感谢
    johnsonxie83
        214
    johnsonxie83  
       15 天前
    楼主能不能私下分享一下,很想学习一下,感谢感谢
    d1572862827
        215
    d1572862827  
       15 天前
    大佬求一个视频教程哇~
    ulpyxua
        216
    ulpyxua  
       15 天前
    视频不见了。
    haipenglisvillt
        217
    haipenglisvillt  
       15 天前
    b 站视频过期了,重新发一个昂
    haipenglisvillt
        218
    haipenglisvillt  
       15 天前
    @baby0w0 楼主大大,给个视频,膜拜一下
    xp
        219
    xp  
       15 天前
    用的啥模型
    xp
        220
    xp  
       15 天前
    用得啥模型
    kenvix
        221
    kenvix  
       14 天前
    @Kasine #91 有实际收益的。
    搜打撤类游戏,你在后面什么也不干就摸鱼,然后大哥打完架了你开变声器请求大哥让你舔包
    啥也不干就狂赚了属于是
    5waker
        222
    5waker  
       14 天前
    @baby0w0 雅美喽,我还在等你的视频学习,怎么突然下架了。求私
    NakanoAzure
        223
    NakanoAzure  
       14 天前
    曼波变声器怎么弄啊,好像也没搜到开源的
    f11st1
        224
    f11st1  
       14 天前
    不愿意分享就别发出来哗众取宠,方案在愿意折腾的人手里也不是搞不出来
    baby0w0
        225
    baby0w0  
    OP
       14 天前
    @f11st1 就是因为你这样的人太多了, 我才把视频删除了.
    5waker
        226
    5waker  
       14 天前
    @baby0w0 分享别看差评,要看好评
    byranb
        227
    byranb  
       14 天前
    内射了吗
    liranvv
        228
    liranvv  
       13 天前
    蹲个楼主分享
    Mast
        229
    Mast  
       13 天前
    一看 OP 就是年轻人,受不了一点压力,哈哈,你这种心态就不要放出来,以免自己心态爆炸。
    d1572862827
        230
    d1572862827  
       13 天前
    @baby0w0 楼主还是很希望可以学习下的...可以给个关键词什么的也可以啊
    ota
        231
    ota  
       13 天前
    @f11st1 主要是标题党,ta 这个标题先把 ai 变身 这个热门关键字加点权重,然后内容端用 主从分离 这个关键字来让大家觉得 op 主的确有做 process 的解构。看得出偏向落地实操。
    其实把。就是整合而已。也根本不用两台机器。用虚拟声卡,类似 Voicemeeter 即可,单机性能够强的情况下,做主从会增加不少网络 jitter ,我没实测过,但起码+15ms 以上。
    第二点,ai 变声推理其实并不怎么吃显卡。所以单机即可。大部分变声模型,比如 rvc svc 这些,你 rtx 20 系列都能很顺利的跑起来,而且占用通常 5-15%。既然不占用游戏帧率,所以 op 主的这套分离意义并不大。毕竟 op 也说了,主要是吸引添狗用的。

    但凡不是同时要跑 vtuber 之类的虚拟 avatar 这种应用,游戏+变身其实没那么复杂。

    还有,op 主不想分享是其自由,人家只想听好话,想被认可想受到正向赞美,这是可以理解的。毕竟新手都有这样的过程,v2 的老人们是不是稍微对新人有点苛刻了?

    我觉得技术落地,探讨,最好还是 reddit 或者 note 这类平台比较好。都是很正向的分享,投稿人的素养也是 ok 的。

    总结:op 给了思路,其实已经 ok 了。具体流程我们真的不要太纠结。
    d1572862827
        232
    d1572862827  
       13 天前
    @ota 可以咨询下思路什么的吗....或者 github 地址也可以...之前 up 的视频没看到
    ota
        233
    ota  
       12 天前
    @d1572862827 Voicemeeter 拿来做音频路由,免费版就行了,有钱上个 potato 也不贵。
    ai 变声器自己找一个跑就好,大多数是 RVC 。训练好的模型也有很多,我主要混日系的,国内不太清楚。比如这个:
    https://chihaya369.booth.pm/items/4701666 可以参考参考。其实还算自然。没有太多噪点。
    但要减少 lag 硬件配置和音频路由方面要设置好,一般 30ms 左右其实你已经不会感觉不同步的了。基本 wdm 就已经够用了,你用 asio 则能更进一步降低延迟。
    baby0w0
        234
    baby0w0  
    OP
       12 天前
    @ota 不知道你用过 rvc 没,首先游戏不锁帧的话 rvc 必然卡机关枪, 哪怕你是 5090.
    baby0w0
        235
    baby0w0  
    OP
       12 天前
    @ota 第二 有的游戏安全强制检测,你过不去这个检测. 游戏和你的软件无法同时运行
    baby0w0
        236
    baby0w0  
    OP
       12 天前
    @ota 第三 双机走的说硬件通道,不是网络传输.不存在任何延迟,
    baby0w0
        237
    baby0w0  
    OP
       12 天前
    @ota 第四 模型要找人去录音棚录 8 个小时以上中英文,包含笑哭等 日系模型说中文 那就是一耳变声器的感觉.
    ota
        238
    ota  
       12 天前   ❤️ 1
    @baby0w0
    >不知道你用过 rvc 没,首先游戏不锁帧的话 rvc 必然卡机关枪, 哪怕你是 5090.
    这的确,游戏不锁帧就会 gpu 占满导致推理排队。主要还是调度问题。可以解决,小问题。

    >第二 有的游戏安全强制检测,你过不去这个检测. 游戏和你的软件无法同时运行
    反作弊机制我倒没考虑过,因为我不玩游戏,不太了解。这应该就是你需要主从的根本原因了把。不然 rvc +Voicemeeter 没啥问题的。因为我经常看 vtuber 的实现,基本都是这样的方案。但游戏我不玩也不看直播等,所以还真不了解,盲区。

    >第三 双机走的说硬件通道,不是网络传输.不存在任何延迟。
    延迟部分只能说没那么讲究,低于 30ms 就已经无法察觉延迟了。推理的 15ms 是必须的。硬件接入=0 ,虚拟声卡路由一般也能控制在 5-15ms 。

    >第四 模型要找人去录音棚录 8 个小时以上中英文,包含笑哭等 日系模型说中文 那就是一耳变声器的感觉.
    我只是抛砖引玉,可不是说拿日系的来说中文,中文系中没有公开分享的模型吗?如果你的确需要定制化,那我们说的也是一类东西,我是习惯开箱即用,你是自己调教模型。

    @d1572862827
    op 主把思路又整理了下。结论是游戏直播的话,你必须做物理隔绝,甚至 pve 这类虚拟化也不行,因为有反作弊检查。主要是这个导致了主从分离,延迟其实并不是核心问题。
    c466934322
        239
    c466934322  
       12 天前
    技术栈呢,老哥
    d1572862827
        240
    d1572862827  
       12 天前
    @ota 感谢感谢
    d1572862827
        241
    d1572862827  
       12 天前
    @baby0w0 op 真的不在放出视频教程了吗......天天来蹲好几天了...临时网盘链接也可以
    HuPu
        242
    HuPu  
       10 天前 via Android
    楼主你好 我对这个非常感兴趣 想愿意付费咨询 300 元/小时 如果您感兴趣可以加我吗?谢谢
    d29zaGlyZW56eg==
    ffw5b7
        243
    ffw5b7  
       5 天前
    哪里可以获取到语音数据集?有偿购买也许
    baby0w0
        244
    baby0w0  
    OP
       4 天前
    @ffw5b7 你花钱找人帮你录
    1  2  3  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3056 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 13:32 · PVG 21:32 · LAX 05:32 · JFK 08:32
    ♥ Do have faith in what you're doing.