V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
maitiantuzi
V2EX  ›  问与答

不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术

  •  1
     
  •   maitiantuzi · Jul 23, 2020 · 2322 views
    This topic created in 2107 days ago, the information mentioned may be changed or developed.

    主要是整数和小数的识别,用什么开源框架训练,如何训练,准确率相对较高? 用过各大平台的离线识别,纯数字的识别率较低。

    8 replies    2020-07-26 08:42:17 +08:00
    NullPoint
        1
    NullPoint  
       Jul 23, 2020 via Android
    同问文字方面的,中文书写,例如十一点三,这种,如何识别
    ooh
        2
    ooh  
       Jul 23, 2020
    离线识别估计有点难,刚刚试了试三爽录音机里面的语音转写,它有动态修正我试了下正常语速识别率 100%
    ooh
        3
    ooh  
       Jul 23, 2020
    @ooh 看了看离线识别里面的命令词好像也不适合你,查了下有个叫 https://github.com/kaldi-asr/kaldi 的项目可以看看,感觉可以满足你的需求
    gargar
        4
    gargar  
       Jul 24, 2020
    什么是“垂直领域”?
    fishCatcher
        5
    fishCatcher  
       Jul 24, 2020 via iPhone
    各大云平台的自学习模型服务可以自己训练?
    Coast
        6
    Coast  
       Jul 24, 2020 via iPhone
    在第一家公司就负责纯数字串的识别,因为是纯数字识别,语言模型可以固定,相对很小。识别准确率很高。通用的模型识别结果当然不如定制的
    maitiantuzi
        7
    maitiantuzi  
    OP
       Jul 24, 2020
    @Coast 请问主要用的什么框架呢
    Coast
        8
    Coast  
       Jul 26, 2020
    @maitiantuzi 基于 Kaldi 做的。不过其他的也都可以
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   880 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 22:12 · PVG 06:12 · LAX 15:12 · JFK 18:12
    ♥ Do have faith in what you're doing.