现在很多深度学习都是针对图像的,比如识别和换脸等项目。请问是否存在更换声音的项目呢?
比如,使用一个人(声优)的大量数据作为素材,使得以后你说的每一句话都可以被替换为该声优的声线。我依稀记得某个公司实现过,但是找不到了。另外自己做能通过 TF 实现吗?
小白求问
比如,使用一个人(声优)的大量数据作为素材,使得以后你说的每一句话都可以被替换为该声优的声线。我依稀记得某个公司实现过,但是找不到了。另外自己做能通过 TF 实现吗?
小白求问
1
inflationaaron Feb 14, 2018 via iPad
当然有了,Deepmind 的 WaveNet 就可以实现
|
2
kslr Feb 15, 2018
Lyrebird
|