本人接了一个简化 erp 系统的外包,并使用 spring boot + vue.js 来实现了一个前后端分离的系统。
目前客户要求实现的需求为:播报一次查询结果中的某个字段内容(目前定义为整数类型例如 1,2,3,后续可能会改成 A01,B02 )。
目前的问题:
有无有类似开发经验的 hxd 支支招。
1
Latin 2020-05-30 11:21:14 +08:00
方案 1:字段可控的情况下,固定生成要播报的语音放到静态资源目录下前端调用然后播报
方案 2:不可控寻求文本转语音的付费或者免费 api,或者在 erp 是联网情况下可以采用 google 的语音合成等等。 |
2
wttx 2020-05-30 11:39:12 +08:00 via Android
Mozilla 有个开源的语音项目,你试试看?
|
3
baobao1270 2020-05-30 11:45:34 +08:00
1. 如果字段不确定,建议使用科大讯飞 TTS SDK,后端生成音频文件后发到前端播放
2. 如果字段确定,找个公司里的妹子录个音就行了(笑),把音频文件当成静态资源,前端获取后播放 建议音频还是分片,不要整一个很大的音频文件。 |
4
MOONLIGHTT OP @Latin 好的,目前打算自己录了
@wttx 看了一下那个数据集,主要是做为深度学习的语料库用的,而且音频文件好像没有分开,顶不住。 @baobao1270 现在想先确定字段来开发了,不过自己录音感觉怪怪的。。。。 |
5
MOONLIGHTT OP 以防有人和我有相同的问题,记录一下一个找到的数字语音包资源(用于输出金额):
https://github.com/javaexception/VoiceAnnouncements/tree/master/voiceannouncementlibrary/src/main/res/raw |
6
dnnta 2020-05-30 13:23:34 +08:00 2
SpeechSynthesisUtterance
|
7
fzleee 2020-05-30 19:30:15 +08:00 via iPhone
参见六楼 ,有现成浏览器接口可以使用
|
8
MOONLIGHTT OP |
9
Canon1014 2020-05-31 12:16:44 +08:00
学到了
|