对于混合了英文和中文(翻译)的音频,是否有比较成熟的技术产品 /服务可以实现单种语言内容的剥离?类似于自动剪辑为单中文或单英文的音频。
1
XanderChen Apr 4, 2020
emmmm...找个厉害的音频编辑软件,看看有没有独立音轨?然后提取出来?
(是不是叫音轨?有错请指正。) 大概就能想到这方法。还是你想用代码写个提取的工具,ffmpeg 看看有没有相关的方法? 如果没有独立音轨...emmm... 那就等大佬的方案吧... |
2
JerryCha Apr 4, 2020 不知道
大概频域处理吧,两个人的说话声音肯定不一样,响度也可能不一样 当然各自独立一条轨道肯定最容易处理 |
3
V69EX Apr 4, 2020
像 youtube 用的那种语音转字幕的软件,应该可以,字幕上有时间,根据转换后的文字是中文还是英文来反过来将视频分片。
|
4
V69EX Apr 4, 2020 就算软件只能识别英文也没问题,不能识别的就当中文了。
|
5
llj5935 Apr 4, 2020 讯飞听见的语音技术可以识别中文中夹杂的英文单词,说明其算法能力具备识别中英文的功能。但是他们还没有做剪辑剥离,相信既然能识别,做剥离是很简单的了。
|
6
cnleoyang OP |
8
diggerdu Apr 4, 2020 via iPhone 如果不是一个人说过的可以先做 speaker diarization
|
12
w1573007 Apr 4, 2020 via Android 开源项目:spleeter 。主要是音频人声分离,不过这个主要是对音乐中的人声进行提取,生成干音。楼主可以试试,我用它分离干音品质可以进行重新混音
|
15
300 Apr 4, 2020
你这个 idea 实现起来有点 difficult 啊
|
16
CaiXiaobai Apr 4, 2020
科大讯飞有 声音识别转文字,你值得拥有
|
17
liuzhiyong Apr 5, 2020
同意楼上的,这方面科大讯飞比较猛,用过他们的 TTS,非常牛。
|