用户说出一个发音,比如:
用户的声音 | 返回值 |
---|---|
阿(ā) | a |
波 | b |
阿(ē) | e |
衣 | i |
吃 | chi |
喝 | he |
铁 | tie |
感谢。
1
icedx 2015-02-22 01:14:16 +08:00 2
|
6
icedx 2015-02-22 01:58:38 +08:00
@aheadlead
貌似离线识别只有讯飞有 具体到识别 应该就是开始录音 然后提交刚刚的录音 SDK 会返回一个串 串里包含可能的结果 所以要多找几个人 给语音识别做微调 这点很重要 |
7
Mutoo 2015-02-22 01:59:52 +08:00
感觉一个音太短了,节奏快了的话连续两个相同的音不好识别。why not try this:
Apple Ball Cat Dog |
8
aheadlead OP |
9
icedx 2015-02-22 11:23:57 +08:00
|
10
akfish 2015-02-22 17:32:13 +08:00 1
这需求很简单,只需要识别有限的语言命令。
自己做的话,用HMM(Hidden Markov Model,隐马尔科夫模型)做,源码很多,自己实现也不难。 Windows上的话,M$直接就给你提供了语音识别的API System.Speech.Recognition: https://msdn.microsoft.com/en-us/library/system.speech.recognition(v=vs.110).aspx |