有支持中文的语音转文字的模型么

This topic created in 189 days ago, the information mentioned may be changed or developed.

试过 openAI 的 whisper ,不管是 medium 还是 large V1~V3 ,中文都被污染的非常严重.不是无法识别,就是输出中有不少广告内容.

不知道是否有针对中文训练好的模型或者权重呢,如果能支持 Whisper-faster Whisper.cpp 就更好了

5 replies • 2025-12-19 10:07:28 +08:00

haiku

Dec 18, 2025 via Android

阿里记得有类似的

Auston

Dec 18, 2025

funasr ，里面很多

ModerRAS

Dec 18, 2025

广告那个，有没有可能是因为静音的部分出幻觉了？那种一般做个 vad 都能破掉大部分的。其他的你可以打开硅基流动看看，那边还有一些免费的 asr 模型的，我主要用个阿里那个 sensevoice 。

106npo

Dec 18, 2025 via Android

@ModerRAS 是在有背景音乐时做语音转文字的。vad 也有点误差。不过日语和英文都能很准确的转文字，只有中文没有任何有效的输出，不是空白就是幻觉广告😂

ModerRAS

Dec 19, 2025

@106npo 那就不知道了，我一般不太容易出这些问题，没加 vad 都还算准确，不知道你的是啥情况。我用的是 ggml 的 whisper-large-v3-turbo 。