V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
如果想在 V2EX 获得更好的推广效果,欢迎了解 PRO 会员机制:
https://www.v2ex.com/pro/about
indexError
V2EX  ›  推广

windows 离线语音转文本、语音转文本、实时字幕工具

  •  
  •   indexError · Apr 29 · 459 views

    功能亮点

    • 完全本地推理与存储,不依赖网络

    • 不依赖 GPU ,CPU 速度飞快

    功能介绍

    1. CPU 飞快

      1. i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )

      2. i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )

    2. 实时识别

      1. 支持识别麦克风、系统声音或者双路同时识别。

      2. 支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)

    3. 识别音视频文件

      1. 支持主流音视频文件。

      2. 内置 FFMpeg 处理,可以转换各种格式。

    4. 说话人管理

      1. 内置说话人管理

      2. 可以为每个说话人指定模型进行识别

    5. 强大的编辑与搜索功能

      1. 支持自定义词典。自动调用词典内容进行后处理。

      2. 支持手动编辑,点击识别文本自动跳转到对应音频。

      3. 支持批量删除与替换

      4. 支持全局搜索

    6. 本地 LLM 支持

      1. 内置 ollama 接口,支持一键启动,一键处理。

      2. 可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务

    7. 语言支持

      1. 普通话( 97%)、中文方言( 90%)、英语( 95%)、韩语、日语以及意大利语( 97%)、西班牙语( 96%)、葡萄牙语( 95%)、德语( 95%)、法语( 95%)、俄语( 94%)、乌克兰语( 93%)、波兰语( 93%)、荷兰语( 93%)等 25 种欧洲语言

    官网

    windows 应用商店

    完全免费的安卓版本

    Supplement 1  ·  Apr 29
    windows 商店版本免费试用一个月
    18 replies    2026-05-03 12:01:10 +08:00
    testliyu
        1
    testliyu  
       Apr 29
    用的 parafomer 模型么
    indexError
        2
    indexError  
    OP
       Apr 29
    @testliyu 没 一共四个模型 qwen sensevoice parakeet firered
    testliyu
        3
    testliyu  
       Apr 29
    @indexError 这个模型是你微调过的么
    testliyu
        4
    testliyu  
       Apr 29
    @indexError 1.8B 模型 CPU 推理有这么快的转录比么
    indexError
        5
    indexError  
    OP
       Apr 29
    @testliyu 1.8b 的模型是用来翻译的,我上面的速度是转录速度,不包含大模型处理。
    testliyu
        6
    testliyu  
       Apr 29
    @indexError #5 好的 已下载 支持下
    liuxyon
        7
    liuxyon  
       Apr 29
    测试了安卓端 转文字还是错误比较多,速度挺快
    indexError
        8
    indexError  
    OP
       Apr 29
    @liuxyon 安卓用的是 sensevoice int8 ,参数量比较小。在普通话准确率上,速度快的没他准,准确率高的没他快。大部分本地部署的都会接入这个模型。
    liuxyon
        9
    liuxyon  
       Apr 29
    含有一些陕西方言的哪个能准?
    indexError
        10
    indexError  
    OP
       Apr 29
    @liuxyon windows 版试下 模型 2 和 模型 4 ,这俩都支持多地区中文方言,准确率你得自己试下
    liuxyon
        11
    liuxyon  
       3 days ago
    建议增加编辑音频 视频功能,例如要从一个长音频截取一个人的声纹,但是没有工具,需要另外找工具.
    liuxyon
        12
    liuxyon  
       3 days ago
    模型 2 智能 身份识别不成功,全部都是一个人.
    indexError
        13
    indexError  
    OP
       2 days ago via Android
    @liuxyon windows 端有啊 声纹库,填写完基本信息后,点击加号
    indexError
        14
    indexError  
    OP
       2 days ago via Android
    @liuxyon 你没录上声纹呢
    liuxyon
        15
    liuxyon  
       2 days ago
    @indexError 录了声纹,转文字还是很多错误,达不到使用
    indexError
        16
    indexError  
    OP
       2 days ago
    @liuxyon 如果你是纯方言,开源模型应该搞不定。另外有的不是错误,模型只负责把发音转为文本,但是不保证转为普通话文本。
    liuxyon
        17
    liuxyon  
       2 days ago
    不是纯方言,有口音,错误很大
    indexError
        18
    indexError  
    OP
       1 day ago via Android
    @liuxyon 那就卸载了吧
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   755 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 21:00 · PVG 05:00 · LAX 14:00 · JFK 17:00
    ♥ Do have faith in what you're doing.