V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
mylastfire
V2EX  ›  问与答

请问 V 友,语音转文字的事情。

  •  
  •   mylastfire · Dec 8, 2023 · 1823 views
    This topic created in 873 days ago, the information mentioned may be changed or developed.
    工作需要,经常要把语音讲话转为文字。想请教大家,一是自己搭建个语音转文字的服务,是用 Whisper 模型搭建吗,准确率能达到多少?二是和使用录音笔自带的转文字功能相比,哪个准确度更高一点?三是因为讲话人也就是固定的三五个人,能否进行模型训练,用什么来训练?四是成本大概是多少呢?谢谢。
    7 replies    2023-12-08 15:55:53 +08:00
    charlestang
        1
    charlestang  
       Dec 8, 2023
    如果是中文的话,尤其夹杂方言的话,可以用科大讯飞的录音笔。自带终身免费的转文字方案(成本就是个录音笔的钱)。如果涉及到外语,可能只能选 Whisper 之类的东西了
    mylastfire
        2
    mylastfire  
    OP
       Dec 8, 2023
    @charlestang 感谢。不想为了工作花自己的钱,哈哈。如果自己搭建,还能干点别的事。
    xmuli
        3
    xmuli  
       Dec 8, 2023 via iPhone
    阿里开源的 FunASR 实测效果也很棒,中英识别也很准确。

    采用本地 whisper 不要部署 docker 那一个版本,表现比较拉胯,且间隔短了会返回 error
    mylastfire
        4
    mylastfire  
    OP
       Dec 8, 2023
    @xmuli 收到,多谢,晚上研究一下。
    fydss
        5
    fydss  
       Dec 8, 2023
    PLAY 上面有一个语音转文字的 APP 要求科学上网
    fydss
        6
    fydss  
       Dec 8, 2023
    找到了 叫实时转写 可以试试
    mylastfire
        7
    mylastfire  
    OP
       Dec 8, 2023
    @fydss 收到,感谢,去看看。虽然我目前是倾向于自己搭建一个 哈哈
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5901 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 02:50 · PVG 10:50 · LAX 19:50 · JFK 22:50
    ♥ Do have faith in what you're doing.