我做了个 MacOS 语音输入法， ASR 和 LLM 你用自己的 key，真正的按量付费 - V2EX

Home Sign Up Sign In

爱意满满的作品展示区。

This topic created in 216 days ago, the information mentioned may be changed or developed.

市面上的语音输入法，比如某 GLM ，真的是贵且不好用。

索性手搓一个，用最好的 ASR ，接 sota LLM ！

用的阿里云百炼 FunASR 中文英文准确率都很高，响应速度刷刷的，很爽；
接的 Openrouter ，如果开启 AI 能力可以自己定义技能，在你语音输入后自动对输入内容进行改写；

⚠️这东西需要你自己去申请 key ，申请两个 key 一百块感觉够用一年了

LLM 对语义的理解强的很，不怕你说的多，就怕你给的信息不全，所以我现在用 Codex 或者 Claudecode 已经离不开语音输入了，如果你也是 vibecoding 场景，那必须要试试。

如果你是写小说的作者也可以尝试，AI 润色这时候就有用了，把小说基本信息作为指令的一部分，然后让 AI 帮你转写，是可以直接成稿的。

page 这里有更详细的介绍

https://tianyu19920816.github.io/VoiceInputApp/

Supplement 1 · Jan 24

好了，比赛结束，我宣布其他语音输入法都是垃圾，现在体验最好的是 typeless ，我自己这个项目不会再做了，直接付钱买 typeless 了兄弟们

Supplement 2 · Jan 24

哦对了，用我的推荐链接注册拿 5 美元优惠，会员挺贵
https://www.typeless.com/refer?code=ZBAATRL

语音输入法

15 replies • 2026-01-18 17:10:36 +08:00

1

fulln

Dec 22, 2025

可以接个本地部署的 whisper ，音频模型一般比较小，再接个免费的 LLM 如小米,

2

MindMindMax

Dec 22, 2025

MacOS 内置语音输入，免费

3

Hilong

Dec 22, 2025

这个版本检查有问题哦

4

tianyu1718

OP

Dec 22, 2025

@fulln 推荐用 sota 模型，警惕沉默成本
二楼那哥们的方案——走内置语音，免费，但效果拉

5

tianyu1718

OP

Dec 22, 2025

@MindMindMax 那效果我受不了啊，你试试我这个方案，真的不一样，完全停不下来

6

tianyu1718

OP

Dec 22, 2025

@Hilong 已修复，感谢反馈🙏

7

MindMindMax

Dec 22, 2025

@tianyu1718 不想花钱，ASR 需求刚性较弱

8

Hilong

Dec 22, 2025

@tianyu1718 #6 能支持一下本地的语音模型吗,我本地部署了 whisper

9

dufu1991

Dec 22, 2025

由于选择困难症，打开百炼一大堆模型，不知道选择哪个，然后就没心思继续下去了。这些大厂做产品的能不能把我当成傻子，还要我一个一个去了解你这么多模型的各项区别，太高看我了。

10

tianyu1718

OP

Dec 22, 2025

@dufu1991 不需要选模型，我都给你选好了，你去申请个 key 填进去就行了，百炼乱七八糟的非常难看

11

tianyu1718

OP

Dec 22, 2025

@tianyu1718 妈的，百炼这设计的跟脑残一样，我刚看这哥们说找不到，我寻思去找个 url ，结果我也迷路了
阿里云百炼->API 参考（这里有个指引，点北京或者新加坡）->创建业务空间，创建 API Key

相比于 openrouter ，这就跟吃屎一样，不过这模型确实不错

12

tianyu1718

OP

Dec 22, 2025

@Hilong 不知道你本地部署的服务支不支持流式语音识别，源代码我开放了，你直接拉到本地让 AI 帮你扩展试试

13

dingawm

Dec 22, 2025

你 vibe 用语音是只在家里吗？在公司或者外面没办法用吧

14

ahu

Dec 23, 2025

闪电说，纯本地的

15

gallant94

Jan 18

楼主的项目看起来很好！

我自己现在是用智谱，试用了一圈之后选的。一键按住说话，中英文识别率相当不错，关键是还快。可以用这个邀请链接，可以领 7 天使用和更多积分。直接下载注册只有 3 天：

https://autoglm.zhipuai.cn/?IC=MLE6YLXV

About · Help · Advertise · Blog · API · FAQ · Solana · 896 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 31ms · UTC 22:20 · PVG 06:20 · LAX 15:20 · JFK 18:20
♥ Do have faith in what you're doing.