爱意满满的作品展示区。
kvl

[开源]写了一个本地模型的实时字幕工具😂

  •  
  •   kvl · 21h 30m ago · 788 views

    虽然实时字幕工具已经很多了,不过目前没看到一个免费开源的实时语音翻译工具能满足我的需求:

    1. 完全本地推理,可以离线使用,隐私安全。
    2. 转录质量。个人体感 whisper 等国外的开源模型和系统自带 asr 工具其实对亚洲语言支持并不好,个人认为要处理中日韩语 asr ,现在能用的唯一开源模型就是 qwen3-asr 。翻译用的 Hy-MT2-1.8B 。
    3. 低延迟。在不牺牲质量使用原始权重的条件下优化了推理速度,在 rtx4090 上能够 500ms 左右实时看到结果

    所以我做了这样一个本地运行的实时字幕工具。它基于 Qwen3-ASR-1.7B ,后端在本机启动 ASR WebSocket 服务,桌面端用 Tauri 做轻量字幕窗口。目标是本地单用户看直播、视频、会议等场景。

    目前支持:

    • 本地语音转文字 / 实时字幕
    • Windows/macOS 桌面客户端
    • 后端在 Linux 或 WSL + NVIDIA CUDA GPU 上跑
    • 可选翻译目标语言
    • 系统音频和麦克风采集

    项目地址及演示 demo:

    https://github.com/vauxe/funyi

    https://github.com/vauxe/funyi#demo

    9 replies    2026-06-03 23:49:50 +08:00
    380cc
        1
    380cc  
       16h 51m ago via iPhone
    你好呀 感谢分享 想咨询一下 纯 Macos 平台有没有比较好的本地实时翻译方案呢?我因为工作需要 经常需要 support 日本那边的在线培训 因为培训的语言是日语 所以我在支持此类培训时存在语言障碍 之前有网友推荐了我款软件 用的 Macos26 自带的语言模型来进行听写 同步用一个云模型进行翻译。多次使用下来发觉主要问题在实时听写不准导致翻译结果存在偏差。不知道有没有更好的方案来解决这个问题。谢谢你
    hiqxy
        2
    hiqxy  
       15h 16m ago
    楼上的确定不是拿来看片?
    SHF
        3
    SHF  
       14h 31m ago
    和微软系统自带的那个相比效果怎么样?
    后端可以原生在 windows 上跑吗?不想开 linux 或 wsl ,能否用 llama.cpp ?
    xxxaadsdss
        4
    xxxaadsdss  
       13h 44m ago
    @380cc 自荐一下,我倒是开发了一个 已经上架到 appstore 了。名字叫“秒译”。不过是收费的。可以给 v 友优惠码,免费使用。需要优惠码的话可以找我哈
    380cc
        5
    380cc  
       9h 27m ago
    @hiqxy 技术培训,情况是这样,我们是家外企,需要想全世界分公司的技术人员远程授课,当前日本方面为了节省出差到上海的差旅费,在日本当地找了个日本的工程师代为授课,授课语言为日语,针对在日的技术人员和第三方外包技术人员。为了确保课程质量,我作为监督方来远程监督整个授课课程,课程是通过 MS Teams 来进行。但公司策略限制,无法使用内置的 copilot 进行实时翻译,所以我到处找方法,包括用手机 google tranlate app,发觉听写翻译延迟问题较严重。之前有个网友分享了个 app ,用的 macos26 自带的语言模型,实测下来感觉听写不少都不太对,导致翻译也不太对,需要的是日语转英文实时翻译,不需要日语转中文翻译。因为如果转中文翻译,则更看不懂是什么意思了。因为课程本来就是我用英语教授的,日方现在用日语对日本当地技术人员进行讲授。情况大概是这样。
    380cc
        6
    380cc  
       9h 19m ago
    @xxxaadsdss 谢谢,我晚上安装一下,方便的话发给我邮箱吧: cGVhY2Vtb25nZXIyMDA2QGhvdG1haWwuY29t
    xxxaadsdss
        7
    xxxaadsdss  
       9h 14m ago
    @380cc 加下我微信吧。 后续有什么问题可以帮忙反馈一下。eGlhb21pbmdfc29mdHdhcmU=
    kvl
        8
    kvl  
    OP
       1h 14m ago
    @380cc 看你 mac 的芯片和内存大小,我试了下,我这个项目在 M1 芯片 8GB 内存下把所有模型换成 4bit 量化是无法达到实时效果的。转录中日韩语的开源模型,机器配置高的话可以按参数量(显存预估=参数大小*2)试试 SenseVoice 、Fun-ASR 、Qwen3-ASR ,很多模型不是原生流式的,需要用代码处理成流式的。不行的话就只有 mac 自带或参数更小的模型了。
    kvl
        9
    kvl  
    OP
       1h 8m ago
    @SHF 效果肯定比 windows 自带的好,不然我也没必要重新写一个😂。后端用的一些性能优化的依赖只有 linux wheel ,目前不能在 windows 上跑,除非显卡性能够高,去掉一些优化也能实时。llama 能跑但是不快,达不到实时的性能
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1505 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 16:58 · PVG 00:58 · LAX 09:58 · JFK 12:58
    ♥ Do have faith in what you're doing.