爱意满满的作品展示区。
qfdk
26.34D
0.16D

五一假期写代码不想打字? Mac 语音输入工具 Voilà,送 20 个免费授权

  •  
  •   qfdk ·
    PRO
    ·
    qfdk · 21 days ago · 6324 views

    Demo

    为什么做这个

    去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。

    6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。

    我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。

    目前已经完全融入日常工作流,每天触发上百次,用得很顺手。

    几个比较用心的点

    • 多引擎可选:Soniox / ElevenLabs / 火山引擎 / Groq Whisper / Apple Speech ,按需切换
    • 实时字幕浮窗:说话时能看到识别中的文字流,不用等结果出来才知道说错了
    • AI 自动润色:去口水词、补标点、修口误,置信度高时自动跳过润色省 200ms 延迟
    • 终端友好:Ghostty / iTerm2 / Kitty 通过 Accessibility API 直接走菜单粘贴,不会被 Cmd+V 事件丢字
    • 自定义词汇表:人名、专业术语强制替换,不会再把 "Soniox" 识别成 "骚扰客死"
    • 隐私:本地优先,云端 STT 直连官方 API ,不经过我自己的服务器

    引擎怎么选

    如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:

    • Soniox:中英法日西自动切换,无需指定语种,首字延迟 ~1 秒,海外开发者 / 中英混说场景强推
    • 火山引擎:纯中文最准,但不支持混合识别,碰到英文单词会音译成汉字
    • Groq Whisper:英文最强,但是 HTTP 批量识别不是流式,延迟高
    • ElevenLabs:英文流式好,中文一般
    • Apple Speech:完全本地,隐私最好,但中英混说会跳错语种

    试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。

    仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上

    PS

    • 不订阅、不联网激活、License 文件离线验证
    • 当然了,还有隐藏授权,比如说你想专门体验的老哥也可以信箱私,主要交个朋友.
    • 20 个免费早鸟授权,先到先得,结账时输入折扣码 VOILAV2EX,价格直接归零
    • 官网: https://voilapro.app

    技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。

    Supplement 1  ·  20 days ago
    V 友们太热情了,原本 20 份授权已经发到 100 份 😄

    这波也测出不少 bug ,感谢大家反馈!目前免费授权为 1 个月试用期,之后仍可继续使用(仅限支持离线的苹果模型,无烦人弹窗);其他 provider 为在线模型,有更高需求可自行购买~

    欢迎继续试用、提问题;优质反馈我会送特殊授权 👍

    大家玩得开心最重要!今天有些高产,有些朋友会被提出更新, 这是今天一轮的打磨欢,迎更新下载最新版本.
    Supplement 2  ·  19 days ago
    最近有不少朋友来问授权码,这边也统一说明一下:
    之前的免费授权(早鸟福利)其实已经发完了 🙏

    当然,如果确实有需要,也不用太拘谨,可以单独发邮件和我说一声。
    我这边更看重大家的诚意和实际使用场景,能帮到的还是会尽量支持的 :)

    最早是计划发 20 个,后来陆续加到了 100 个,其实已经超出预期了,而且也有一些朋友领了不止一个… 授权可能就会酌情清理了。如果对早鸟版本感兴趣,也欢迎直接购买支持一下~

    Voilà, c'est tout.
    120 replies    2026-05-14 14:27:28 +08:00
    1  2  
    qfdk
        101
    qfdk  
    OP
    PRO
       16 days ago
    @mylxsw #100 可以给 [email protected] 写一封邮件. 不少 V 友的主动联系私人邮件,我都会认真回复的, 开发者授权,特殊授权,都是我会手动发放的 :)

    分享一下,当用户留信箱,等主动发去授权的,大多数没有激活. 我更希望是授权会发给有需要的朋友.
    qfdk
        102
    qfdk  
    OP
    PRO
       16 days ago
    @mylxsw #100 已发
    EdwardKot
        103
    EdwardKot  
       16 days ago   ❤️ 1
    @qfdk #95 今天试用了一下有 2 个问题想问,1 ,快捷键似乎无法绑定我外接键盘的“end”键,因为之前 lazytyper 绑在这个键上,习惯了,但是发现 voila 录不进这个键(其他一些 home 啥的也录不进,但是确实 cmd+字母键是可以)。2 ,我先尝试了“apple 语音”,无论说这么话,都只能识别一个“you”,不知道是不是我哪里设置的不对?其次我用 Groq ,无论说什么,都是“请不吝点赞 订阅 转发 打赏支持明镜与点点栏目”,其他的 api 还没去搞,但是这两个的尝试让我现在还没用上,哈哈
    qfdk
        104
    qfdk  
    OP
    PRO
       16 days ago
    @EdwardKot 感谢您认真测试!

    1. 是这样的,因为 voila 的设计是组合键,单独按键理论上也是不会录入的.主要目的是为了让你知道我在按下这两个组合键的时候,我就应该对我说出的话负责。跟核弹发射一样,不只是一个按钮,需要两把钥匙。

    2. 这个问题我搜索了一下,这个出在 Groq 后面用的 Whisper 的 API 的问题。这个属于说语音 provider 的一个问题。

    https://github.com/openai/whisper/discussions/2645
    https://github.com/openai/whisper/discussions/1783

    3. 苹果语音只能识别一个 you ? 您方便提供一下系统截图吗 因为苹果语音使用的底层 API 是跟你的系统语言有所绑定,或者是要指定语言。它分为 macOS 26 的引擎,还有经典引擎。经典引擎是 macOS 26 之外的离线引擎。

    耽误您的时间了,本人主力使用 Soniox 。

    再次感谢反馈!
    EdwardKot
        105
    EdwardKot  
       16 days ago
    @qfdk #104
    1 ,收到。
    2 ,但是我用 lazy 那个也是 Groq 的 api ,模型选择也是一样,回复这条消息的时候也能正常识别,就很奇怪,之后我又试了把 lazy 用的那个 api 放进来试了之后问题也没有解决,很奇怪。
    3 ,系统截图需要提供哪个部分的?我看了我的地区和语言都是中国大陆。试这个的原因是,我想着没网的时候也不影响使用,顺便看看效果,之前不知道还有 Apple 语音,只用过 Qwen3-ASR 。

    厚颜无耻也先求个码,问题解决后,我对比一下效果选择留一个工具( Z2VzaGVuZmVuZzFAZ21haWwuY29t )
    qfdk
        106
    qfdk  
    OP
    PRO
       16 days ago
    @EdwardKot #105 yo, 邮件联系您了.
    mirror
        107
    mirror  
       15 days ago   ❤️ 1
    @qfdk #57 已氪
    qfdk
        108
    qfdk  
    OP
    PRO
       15 days ago
    @mirror 非常感谢您的支持! 任何需求,有求必应, voilà~
    panghu960
        109
    panghu960  
       14 days ago
    语音输入在 coding 场景里我最在意两个点:一个是中英混输不要太割裂,另一个是粘贴到终端 / 编辑器时不要丢格式。很多工具日常聊天够用,但一到命令、文件名、变量名就容易翻车。

    如果每天高频触发,上屏延迟和可撤销也很关键。识别错一次不麻烦,麻烦的是错了之后改起来比自己打字还慢。
    qfdk
        110
    qfdk  
    OP
    PRO
       14 days ago via iPhone
    @panghu960 很诚恳的建议,你说的上屏问题我也在思考. 现在在想的一个跟老罗的大爆炸风格一样,可以在上屏前改东西. 还在构思 ing
    qfdk
        111
    qfdk  
    OP
    PRO
       14 days ago via iPhone
    @qfdk 中外文混合输入是 soniox 跟 voila 主打,浮动窗是 voila 的关键,那个消失延迟是想着后面加纠错. 您有更好的想法也欢迎分享.
    followadc
        112
    followadc  
       13 days ago
    送我一个么宝贝
    kasusa
        113
    kasusa  
       13 days ago
    呃这个和微信那个比有什么更好的地方呢
    qfdk
        114
    qfdk  
    OP
    PRO
       13 days ago
    @followadc 当然可以,先下载试用,有啥不妥的地方邮件我 换取特殊授权,官网有详细介绍

    @kasusa 这里主要是对于混合输入,留学海外语境非常好用,还有专门的字幕模式,这个是别的完全没有的,这是完全两个定位哈,voila 是真针对于日常使用,也可以自己调教 :)

    bao3
        115
    bao3  
       12 days ago
    已购买早鸟版。

    只是。。。有个小问题,为什么早鸟显示的 License 有效期是 2036 年,10 年。。。。。
    qfdk
        116
    qfdk  
    OP
    PRO
       12 days ago
    @bao3 感谢购买. 早鸟显示 10 年 还是会继续维护的.放心好了,不是 bug, 终生授权,是作者我本人的终生哈, 只要还能干活就会继续的,放心 :) 都是终生授权,稍后邮件联系你下.
    qfdk
        117
    qfdk  
    OP
    PRO
       11 days ago
    @panghu960 #109 您好感谢您的提议,针对您的方法. 我做了一个小的改进,正在测试中,测试完毕不知道可否有渠道联系您进行一个测试呢?
    bao3
        118
    bao3  
       11 days ago   ❤️ 1
    @qfdk 太感谢了,我已经收到了你的 license 。这个语音输入法很好用,自定义词库可以把各种标点符号放到修正那里。即使是使用 Apple 本地的语音文本识率也很高。
    47jm9ozp
        119
    47jm9ozp  
       9 days ago   ❤️ 1
    @qfdk #32 希望提供配置导出导出功能,在第二台设备上安装时候还要填一大堆东西……

    希望提供双击 alt/cmd 触发快捷键
    qfdk
        120
    qfdk  
    OP
    PRO
       9 days ago
    @47jm9ozp hello 这个导出之前有想着做,后来一想理论上没有这么多设备然后就填一次,做了会邮件通知您.

    只不过现在在优化另外的一个新功能,这周会更新.

    快捷键这里好多人还需要单个发射 这个也记下了.
    1  2  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2756 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 48ms · UTC 02:19 · PVG 10:19 · LAX 19:19 · JFK 22:19
    ♥ Do have faith in what you're doing.