V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
106npo
V2EX  ›  OpenAI

有支持中文的语音转文字的模型么

  •  
  •   106npo · 2 天前 · 363 次点击

    试过 openAI 的 whisper ,不管是 medium 还是 large V1~V3 ,中文都被污染的非常严重.不是无法识别,就是输出中有不少广告内容.

    不知道是否有针对中文训练好的模型或者权重呢,如果能支持 Whisper-faster Whisper.cpp 就更好了

    5 条回复    2025-12-19 10:07:28 +08:00
    haiku
        1
    haiku  
       1 天前 via Android
    阿里记得有类似的
    Auston
        2
    Auston  
       1 天前
    funasr ,里面很多
    ModerRAS
        3
    ModerRAS  
       1 天前
    广告那个,有没有可能是因为静音的部分出幻觉了?那种一般做个 vad 都能破掉大部分的。其他的你可以打开硅基流动看看,那边还有一些免费的 asr 模型的,我主要用个阿里那个 sensevoice 。
    106npo
        4
    106npo  
    OP
       1 天前 via Android
    @ModerRAS 是在有背景音乐时做语音转文字的。vad 也有点误差。不过日语和英文都能很准确的转文字,只有中文没有任何有效的输出,不是空白就是幻觉广告😂
    ModerRAS
        5
    ModerRAS  
       21 小时 32 分钟前
    @106npo 那就不知道了,我一般不太容易出这些问题,没加 vad 都还算准确,不知道你的是啥情况。我用的是 ggml 的 whisper-large-v3-turbo 。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1029 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 23:39 · PVG 07:39 · LAX 15:39 · JFK 18:39
    ♥ Do have faith in what you're doing.