1
fulln 5 天前
可以接个本地部署的 whisper ,音频模型一般比较小, 再接个免费的 LLM 如小米,
|
2
MindMindMax 5 天前
MacOS 内置语音输入,免费
|
3
Hilong 5 天前
|
4
tianyu1718 OP @fulln 推荐用 sota 模型,警惕沉默成本
二楼那哥们的方案——走内置语音,免费,但效果拉 |
5
tianyu1718 OP @MindMindMax 那效果我受不了啊,你试试我这个方案,真的不一样,完全停不下来
|
6
tianyu1718 OP @Hilong 已修复,感谢反馈🙏
|
7
MindMindMax 5 天前
@tianyu1718 不想花钱,ASR 需求刚性较弱
|
8
Hilong 4 天前
@tianyu1718 #6 能支持一下本地的语音模型吗,我本地部署了 whisper
|
9
dufu1991 4 天前
由于选择困难症,打开百炼一大堆模型,不知道选择哪个,然后就没心思继续下去了。这些大厂做产品的能不能把我当成傻子,还要我一个一个去了解你这么多模型的各项区别,太高看我了。
|
10
tianyu1718 OP @dufu1991 不需要选模型,我都给你选好了,你去申请个 key 填进去就行了,百炼乱七八糟的非常难看
|
11
tianyu1718 OP @tianyu1718 妈的,百炼这设计的跟脑残一样,我刚看这哥们说找不到,我寻思去找个 url ,结果我也迷路了
阿里云百炼->API 参考(这里有个指引,点北京或者新加坡)->创建业务空间,创建 API Key 相比于 openrouter ,这就跟吃屎一样,不过这模型确实不错 |
12
tianyu1718 OP @Hilong 不知道你本地部署的服务支不支持流式语音识别,源代码我开放了,你直接拉到本地让 AI 帮你扩展试试
|
13
dingawm 4 天前
你 vibe 用语音是只在家里吗?在公司或者外面没办法用吧
|
14
ahu 3 天前
闪电说,纯本地的
|