V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Cyron
V2EX  ›  分享创造

TransFlow — 我 vibe 了一个实时语音转录 + 翻译 MacOS App

  •  1
     
  •   Cyron · 6 天前 · 214 次点击

    前言

    迫于 Zoom 的转录实在不好用(不能双语对照显示、不能复制导出),我也尝试找了一些 App ,但都感觉不太满足需求,所以决定自己 vibe coding 一个。

    核心就是

    • 实时转录+翻译,并且双语对照显示,随时浏览历史
    • 支持导出,方便 AI 分析总结
    • 性能高但成本要低

    于是我和 Grok 大战了三百回合,聊了很多技术、设计、文案(为了省 token ),然后和 claude-4.6 把项目 vibe 了出来。

    官网 & 下载地址

    ✨ 核心功能

    • 🎙️ 实时语音转录
      基于 Apple Speech 框架 + Neural Engine 硬件加速,准确率较高,适合长时间会议、讲座、对话

    • 🌐 实时翻译
      转录结果实时翻译,使用 Apple Translation 框架,支持 macOS 内置的所有语言

    • 🔊 应用音频捕获
      通过 ScreenCaptureKit 直接抓取其他应用的音频( Teams 、Zoom 、YouTube 、浏览器等),无需扬声器外放

    • 🔒 完全离线 & 隐私优先
      语音识别和翻译全部在设备端运行,无需联网,无数据上传

    • 📜 历史记录
      自动保存每次会话,支持浏览、预览、重命名、删除

    • 📤 导出
      一键导出为 SRT 字幕Markdown 格式,方便后续整理或做会议纪要

    • ⚙️ 个性化设置
      语言偏好、外观模式(浅色/深色/跟随系统)

    • 🪶 极致轻量
      安装包不到 900KB,下载即用,毫无负担

    🛠️ 技术栈

    技术 说明
    Swift 6.0 主语言,用了大量现代并发特性
    SwiftUI 声明式 UI ,纯原生 macOS 体验
    Speech Apple 原生语音识别,Neural Engine 加速
    Translation Apple 原生设备端翻译框架
    AVFoundation 音频处理基础
    ScreenCaptureKit 捕获其他 App 音频流
    MVVM + @Observable 现代 SwiftUI 响应式架构

    🗺️ Roadmap

    • 集成 FluidAudio 框架
    • 支持 Whisper 、Parakeet 等第三方模型
    • 识别不同说话人
    • 同时监听 App 和麦克风
    • 自定义界面样式
    • 自定义更多快捷键
    • ……欢迎提更多想法!

    欢迎一起玩 & 提需求

    TransFlow 现在还是个非常 early 的小项目。

    我也建了一个微信群(二维码在 Github Readme ),欢迎进来交流使用感受、想法、甚至一起 brainstorm 下新功能。

    希望 TransFlow 能帮到你,也期待大家的反馈和想法!

    目前尚无回复
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1705 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 05:49 · PVG 13:49 · LAX 21:49 · JFK 00:49
    ♥ Do have faith in what you're doing.