请问有简单的办法可以做到识别发音吗？（拼音）

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3563 天前的主题，其中的信息可能已经有所发展或是发生改变。

用户说出一个发音，比如：

用户的声音	返回值
阿(ā)	a
波	b
阿(ē)	e
衣	i
吃	chi
喝	he
铁	tie

感谢。

发音

拼音

识别

10 条回复 • 2015-02-22 17:32:13 +08:00

icedx

2015-02-22 01:14:16 +08:00

最简单 http://developer.baidu.com/wiki/index.php?title=docs/cplat/media/voice/sdk
最逼格 http://blog.csdn.net/dlangu0393/article/details/7214728
最流行 http://open.voicecloud.cn/

aheadlead

2015-02-22 01:17:43 +08:00

@icedx 我就念一个字能识别吗？谢

icedx

2015-02-22 01:19:26 +08:00

@aheadlead 能啊

aheadlead

2015-02-22 01:30:08 +08:00

@icedx 请详细说说。我想要离线识别，比如说做个选择题，我希望能语音念ABCD来做题，节奏要比较快。

qiayue

2015-02-22 01:52:37 +08:00

@aheadlead 我觉得直接按 ABCD 更快吧，都是一个键

icedx

2015-02-22 01:58:38 +08:00

@aheadlead
貌似离线识别只有讯飞有具体到识别应该就是开始录音然后提交刚刚的录音 SDK 会返回一个串串里包含可能的结果所以要多找几个人给语音识别做微调这点很重要

Mutoo

2015-02-22 01:59:52 +08:00

感觉一个音太短了，节奏快了的话连续两个相同的音不好识别。why not try this:
Apple
Ball
Cat
Dog

aheadlead

2015-02-22 10:02:56 +08:00 via iPhone

@qiayue 只是举个例子嘛…总会有不适合按的情况
@icedx 他们不仅要钱 linux试用sdk还不让下QAQ
@Mutoo - - 正因为不好识别才提这个问题啊

icedx

2015-02-22 11:23:57 +08:00

你可以把讯飞放在安卓里然后写个Web API 最后把网卡桥接出来

我还找到这个 http://blog.csdn.net/songgeabc/article/details/8570026

akfish

2015-02-22 17:32:13 +08:00

这需求很简单，只需要识别有限的语言命令。
自己做的话，用HMM（Hidden Markov Model，隐马尔科夫模型）做，源码很多，自己实现也不难。
Windows上的话，M$直接就给你提供了语音识别的API System.Speech.Recognition：
https://msdn.microsoft.com/en-us/library/system.speech.recognition(v=vs.110).aspx