201
andy101wong 17 天前
大佬你这双机方案延迟控制的太顶了 我也想搞搞延迟低的 哪个具体开源项目值得试试啊
|
202
sickick 17 天前
程序员论坛到最后也是秀一手不公开项目地址
|
203
qiuyue0 17 天前
坐等教程
|
204
Leon6868 16 天前
|
205
hentailolicon 16 天前
一边回复不是 rvc 一边视频说 rvc 纯低能浪费大家时间
|
207
baby0w0 OP @hentailolicon 可惜你连 rvc 都没弄清楚,如果你弄清楚了就不会纠结是不是 r v c
|
208
baby0w0 OP @hentailolicon 比如连 java 基础语法都不会的人,已经开始想知道怎么用 java 操作数据库了, 这才是纯低能。
|
209
balaWgc 15 天前
视频怎么不见了
|
211
youyoumarco 15 天前
视频被抬了吗?
|
212
baby0w0 OP @youyoumarco 有的人 给他分享,还说你分享的东西浪费时间, 可是明明就是他 “连走都没学会,就想着跑”.
这样的人有点多 我就删了 |
213
Grooveys 15 天前
楼主求留个网盘地址~我想学习一下,感谢感谢
|
214
johnsonxie83 15 天前
楼主能不能私下分享一下,很想学习一下,感谢感谢
|
215
d1572862827 15 天前
大佬求一个视频教程哇~
|
216
ulpyxua 15 天前
视频不见了。
|
217
haipenglisvillt 15 天前
b 站视频过期了,重新发一个昂
|
218
haipenglisvillt 15 天前
@baby0w0 楼主大大,给个视频,膜拜一下
|
219
xp 15 天前
用的啥模型
|
220
xp 15 天前
用得啥模型
|
223
NakanoAzure 14 天前
曼波变声器怎么弄啊,好像也没搜到开源的
|
224
f11st1 14 天前
不愿意分享就别发出来哗众取宠,方案在愿意折腾的人手里也不是搞不出来
|
227
byranb 14 天前
内射了吗
|
228
liranvv 13 天前
蹲个楼主分享
|
229
Mast 13 天前
一看 OP 就是年轻人,受不了一点压力,哈哈,你这种心态就不要放出来,以免自己心态爆炸。
|
230
d1572862827 13 天前
@baby0w0 楼主还是很希望可以学习下的...可以给个关键词什么的也可以啊
|
231
ota 13 天前
@f11st1 主要是标题党,ta 这个标题先把 ai 变身 这个热门关键字加点权重,然后内容端用 主从分离 这个关键字来让大家觉得 op 主的确有做 process 的解构。看得出偏向落地实操。
其实把。就是整合而已。也根本不用两台机器。用虚拟声卡,类似 Voicemeeter 即可,单机性能够强的情况下,做主从会增加不少网络 jitter ,我没实测过,但起码+15ms 以上。 第二点,ai 变声推理其实并不怎么吃显卡。所以单机即可。大部分变声模型,比如 rvc svc 这些,你 rtx 20 系列都能很顺利的跑起来,而且占用通常 5-15%。既然不占用游戏帧率,所以 op 主的这套分离意义并不大。毕竟 op 也说了,主要是吸引添狗用的。 但凡不是同时要跑 vtuber 之类的虚拟 avatar 这种应用,游戏+变身其实没那么复杂。 还有,op 主不想分享是其自由,人家只想听好话,想被认可想受到正向赞美,这是可以理解的。毕竟新手都有这样的过程,v2 的老人们是不是稍微对新人有点苛刻了? 我觉得技术落地,探讨,最好还是 reddit 或者 note 这类平台比较好。都是很正向的分享,投稿人的素养也是 ok 的。 总结:op 给了思路,其实已经 ok 了。具体流程我们真的不要太纠结。 |
232
d1572862827 13 天前
@ota 可以咨询下思路什么的吗....或者 github 地址也可以...之前 up 的视频没看到
|
233
ota 12 天前
@d1572862827 Voicemeeter 拿来做音频路由,免费版就行了,有钱上个 potato 也不贵。
ai 变声器自己找一个跑就好,大多数是 RVC 。训练好的模型也有很多,我主要混日系的,国内不太清楚。比如这个: https://chihaya369.booth.pm/items/4701666 可以参考参考。其实还算自然。没有太多噪点。 但要减少 lag 硬件配置和音频路由方面要设置好,一般 30ms 左右其实你已经不会感觉不同步的了。基本 wdm 就已经够用了,你用 asio 则能更进一步降低延迟。 |
238
ota 12 天前 @baby0w0
>不知道你用过 rvc 没,首先游戏不锁帧的话 rvc 必然卡机关枪, 哪怕你是 5090. 这的确,游戏不锁帧就会 gpu 占满导致推理排队。主要还是调度问题。可以解决,小问题。 >第二 有的游戏安全强制检测,你过不去这个检测. 游戏和你的软件无法同时运行 反作弊机制我倒没考虑过,因为我不玩游戏,不太了解。这应该就是你需要主从的根本原因了把。不然 rvc +Voicemeeter 没啥问题的。因为我经常看 vtuber 的实现,基本都是这样的方案。但游戏我不玩也不看直播等,所以还真不了解,盲区。 >第三 双机走的说硬件通道,不是网络传输.不存在任何延迟。 延迟部分只能说没那么讲究,低于 30ms 就已经无法察觉延迟了。推理的 15ms 是必须的。硬件接入=0 ,虚拟声卡路由一般也能控制在 5-15ms 。 >第四 模型要找人去录音棚录 8 个小时以上中英文,包含笑哭等 日系模型说中文 那就是一耳变声器的感觉. 我只是抛砖引玉,可不是说拿日系的来说中文,中文系中没有公开分享的模型吗?如果你的确需要定制化,那我们说的也是一类东西,我是习惯开箱即用,你是自己调教模型。 @d1572862827 op 主把思路又整理了下。结论是游戏直播的话,你必须做物理隔绝,甚至 pve 这类虚拟化也不行,因为有反作弊检查。主要是这个导致了主从分离,延迟其实并不是核心问题。 |
239
c466934322 12 天前
技术栈呢,老哥
|
240
d1572862827 12 天前
@ota 感谢感谢
|
241
d1572862827 12 天前
@baby0w0 op 真的不在放出视频教程了吗......天天来蹲好几天了...临时网盘链接也可以
|
242
HuPu 10 天前 via Android
楼主你好 我对这个非常感兴趣 想愿意付费咨询 300 元/小时 如果您感兴趣可以加我吗?谢谢
d29zaGlyZW56eg== |
243
ffw5b7 5 天前
哪里可以获取到语音数据集?有偿购买也许
|