分享一个音频 AIGC 开源项目，适合想要转行 AIGC 方向的同学

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 909 days ago, the information mentioned may be changed or developed.

Amphion：一个开源的音频、音乐和语音生成项目。由大名鼎鼎的 OpenMMLab 联合香港中文大学（深圳）联合推出的。硅谷大佬也给这个项目带货，打了 A+++级： https://www.bilibili.com/video/BV18w411V7iq/

支持如下功能：

文本转语音（ TTS ）：高性能，支持主流模型及架构，可生成自然的声音。
歌声转换（ SVC ）：可将某人歌声转换成其他人歌声，内置张学友、陈奕迅、王菲等已训练好的声音。
文本转音频（ TTA ）：可通过文本提示，生成逼真的声效、语音以及音乐，类似于 AudioLDM 。

GitHub：github.com/open-mmlab/Amphion

以上功能均可在 HuggingFace 上使用。

地址：huggingface.co/amphion

aigc

文本

歌声

生成

17 replies • 2023-12-27 13:49:07 +08:00

raycool

Dec 25, 2023

不错，现在 TTS 的研究也越来越多了
对 openai 的 TTS 效果还是蛮感兴趣的，感觉是目前天花板。

wswlaz

Dec 25, 2023

TTS 不支持中文吗

gues

Dec 25, 2023

@wswlaz 可以提要求来支持中文

gues

Dec 25, 2023

@raycool 是的，现在 TTS 和音效生成、音乐生成都很火，很多应用场景和工作机会，还没那么卷

yao978318542

Dec 25, 2023

好像不支持中文啊

flyqie

Dec 25, 2023 via Android

@raycool #1

目前 tts 天花板应该是微软吧？

gues

Dec 25, 2023

@yao978318542 有兴趣的话，可以上手来加一下。我去反馈给开源团队

capgrey

Dec 25, 2023

GitHub 仓库演示的《稻香》，我哭死😭

qW7bo2FbzbC0

Dec 25, 2023

顺路问下，声音模型怎么训练？我看 github 上 svc 项目很多都声明不适用声音模型训练，而国内很多文章或者教程都是用 sovit 或者 svc 来出效果？

Pepega

Dec 25, 2023

很感兴趣，我目前看到的 tts 最赚钱的例子是直播打赏，请问训练出个性化声音的 tts 成本高吗，让用户自己训练自己的 tts 呢？
link：dHRzLm1vbnN0ZXI=

dorm

Dec 25, 2023

适用了一下，声音非常沙哑，就像是嗓子有痰似的

AdminRoot123

Dec 25, 2023

用了一下中文效果贼差文字读的都不正确很长的噪音

gues

Dec 25, 2023

@AdminRoot123 模型应该还没有用中文数据训练过

gues

Dec 25, 2023

@dorm 哪个声音？

dorm

Dec 26, 2023

@gues singing_voice_conversion 上传了一个《向天再借五百年》 target Singer 随便选一个都是很沙哑的

gues

Dec 27, 2023

@dorm 音频可以私信发给我一下嘛？我们看看。系统还在升级，1 月份会有一个更有的版本

dorm

Dec 27, 2023

@gues https://file.io/PPaCceZyAqhS