与平常的语音识别,语音转文字不同, 我需要语音识别转出对应发音的拼音和声调
看了腾讯云, 百度云, 阿里云基本只提供语音转文字的接口, 没法满足需求
大伙有没有这方面的工具, 接口或者思路
PS 有人会说"语音转文字, 文字再转拼音", 用这种方式的话, 比如我在音频里读的是"管东", 语音识别结果会修正并返回"广东", 再转拼音就成了 guang dong, 但我实际的发音是 guan dong
看了腾讯云, 百度云, 阿里云基本只提供语音转文字的接口, 没法满足需求
大伙有没有这方面的工具, 接口或者思路
PS 有人会说"语音转文字, 文字再转拼音", 用这种方式的话, 比如我在音频里读的是"管东", 语音识别结果会修正并返回"广东", 再转拼音就成了 guang dong, 但我实际的发音是 guan dong