原本做内容是正在使用 TTS 的,但要人工打字,对时间轴
看最近很多的 AI 歌手,就尝试了 so-vits-svc (现在是 4.1 了),想着用它替换掉自己说话的口音,变成一个咬字清晰的普通男中音
最后发现只是浪费了 N 个小时!
浪费了 N 个小时之后的结论
网上别人分享的模型很多都是萝莉女音(又懒得自己训练)
唱歌训练出来的模型也不适合讲话,会由普通话变成四川话或河南话
使用那个最普遍的 AI 孙某著名女歌手也不行
1
optional 2023-06-09 11:56:53 +08:00 via iPhone
试试 bark
|
2
evemoo 2023-06-09 16:27:09 +08:00
vits 和 sovits 是两个东西
|