迫于 Zoom 的转录实在不好用(不能双语对照显示、不能复制导出),我也尝试找了一些 App ,但都感觉不太满足需求,所以决定自己 vibe coding 一个。
核心就是
于是我和 Grok 大战了三百回合,聊了很多技术、设计、文案(为了省 token ),然后和 claude-4.6 把项目 vibe 了出来。

🎙️ 实时语音转录
基于 Apple Speech 框架 + Neural Engine 硬件加速,准确率较高,适合长时间会议、讲座、对话
🌐 实时翻译
转录结果实时翻译,使用 Apple Translation 框架,支持 macOS 内置的所有语言
🔊 应用音频捕获
通过 ScreenCaptureKit 直接抓取其他应用的音频( Teams 、Zoom 、YouTube 、浏览器等),无需扬声器外放
🔒 完全离线 & 隐私优先
语音识别和翻译全部在设备端运行,无需联网,无数据上传
📜 历史记录
自动保存每次会话,支持浏览、预览、重命名、删除
📤 导出
一键导出为 SRT 字幕 或 Markdown 格式,方便后续整理或做会议纪要
⚙️ 个性化设置
语言偏好、外观模式(浅色/深色/跟随系统)
🪶 极致轻量
安装包不到 900KB,下载即用,毫无负担
| 技术 | 说明 |
|---|---|
| Swift 6.0 | 主语言,用了大量现代并发特性 |
| SwiftUI | 声明式 UI ,纯原生 macOS 体验 |
| Speech | Apple 原生语音识别,Neural Engine 加速 |
| Translation | Apple 原生设备端翻译框架 |
| AVFoundation | 音频处理基础 |
| ScreenCaptureKit | 捕获其他 App 音频流 |
| MVVM + @Observable | 现代 SwiftUI 响应式架构 |
TransFlow 现在还是个非常 early 的小项目。
我也建了一个微信群(二维码在 Github Readme ),欢迎进来交流使用感受、想法、甚至一起 brainstorm 下新功能。
希望 TransFlow 能帮到你,也期待大家的反馈和想法!