如果想在 V2EX 获得更好的推广效果，欢迎了解 PRO 会员机制：
https://www.v2ex.com/pro/about

如果你经常使用铜币置顶主题，持有 V2EX Solana Token 会在每日签到时获得额外铜币：
https://www.v2ex.com/solana

This topic created in 94 days ago, the information mentioned may be changed or developed.

功能亮点

indexError · 2026-04-29T01:22:46Z

功能亮点完全本地推理与存储，不依赖网络不依赖 GPU ，CPU 速度飞快功能介绍 CPU 飞快 i5-11400H：30min 的音频 1min 就能处理完（五年前的 CPU ） i5-4210m：30min 的音频 3min 就能处理完（十年前的 CPU ）实时识别支持识别麦克风、系统声音或者双路同时识别。支持字幕和语音输入模式，支持同步翻译（通过自部署 LLM 模型，推荐 HY - MT1.5-1.8B ，速度极快）识别音视频文件支持主流音视频文件。内置 FFMpeg 处理，可以转换各种格式。说话人管理内置说话人管理可以为每个说话人指定模型进行识别强大的编辑与搜索功能支持自定义词典。自动调用词典内容进行后处理。支持手动编辑，点击识别文本自动跳转到对应音频。支持批量删除与替换支持全局搜索本地 LLM 支持内置 ollama 接口，支持一键启动，一键处理。可以自定义提示词，使用本地部署的 LLM 模型进行润色、翻译、总结等任务语言支持普通话（ 97%）、中文方言（ 90%）、英语（ 95%）、韩语、日语以及意大利语（ 97%）、西班牙语（ 96%）、葡萄牙语（ 95%）、德语（ 95%）、法语（ 95%）、俄语（ 94%）、乌克兰语（ 93%）、波兰语（ 93%）、荷兰语（ 93%）等 25 种欧洲语言官网 windows 应用商店完全免费的安卓版本

完全本地推理与存储，不依赖网络
不依赖 GPU ，CPU 速度飞快

功能介绍

CPU 飞快
1. i5-11400H：30min 的音频 1min 就能处理完（五年前的 CPU ）
2. i5-4210m：30min 的音频 3min 就能处理完（十年前的 CPU ）
实时识别
1. 支持识别麦克风、系统声音或者双路同时识别。
2. 支持字幕和语音输入模式，支持同步翻译（通过自部署 LLM 模型，推荐 HY - MT1.5-1.8B ，速度极快）
识别音视频文件
1. 支持主流音视频文件。
2. 内置 FFMpeg 处理，可以转换各种格式。
说话人管理
1. 内置说话人管理
2. 可以为每个说话人指定模型进行识别
强大的编辑与搜索功能
1. 支持自定义词典。自动调用词典内容进行后处理。
2. 支持手动编辑，点击识别文本自动跳转到对应音频。
3. 支持批量删除与替换
4. 支持全局搜索
本地 LLM 支持
1. 内置 ollama 接口，支持一键启动，一键处理。
2. 可以自定义提示词，使用本地部署的 LLM 模型进行润色、翻译、总结等任务
语言支持
1. 普通话（ 97%）、中文方言（ 90%）、英语（ 95%）、韩语、日语以及意大利语（ 97%）、西班牙语（ 96%）、葡萄牙语（ 95%）、德语（ 95%）、法语（ 95%）、俄语（ 94%）、乌克兰语（ 93%）、波兰语（ 93%）、荷兰语（ 93%）等 25 种欧洲语言

官网

windows 应用商店

完全免费的安卓版本

Supplement 1 · Apr 29

windows 商店版本免费试用一个月

Supplement 2 · May 15

5.22 号之前免费

已经下载的应该是自动获得正式版签名，没看懂后台的设置逻辑

语音

文本

本地

19 replies • 2026-05-15 14:17:41 +08:00

testliyu

Apr 29

用的 parafomer 模型么

indexError

Apr 29

@testliyu 没一共四个模型 qwen sensevoice parakeet firered

testliyu

Apr 29

@indexError 这个模型是你微调过的么

testliyu

Apr 29

@indexError 1.8B 模型 CPU 推理有这么快的转录比么

indexError

Apr 29

@testliyu 1.8b 的模型是用来翻译的，我上面的速度是转录速度，不包含大模型处理。

testliyu

Apr 29

@indexError #5 好的已下载支持下

liuxyon

Apr 29

测试了安卓端转文字还是错误比较多，速度挺快

indexError

Apr 29

@liuxyon 安卓用的是 sensevoice int8 ，参数量比较小。在普通话准确率上，速度快的没他准，准确率高的没他快。大部分本地部署的都会接入这个模型。

liuxyon

Apr 29

含有一些陕西方言的哪个能准?

indexError

Apr 29

@liuxyon windows 版试下模型 2 和模型 4 ，这俩都支持多地区中文方言，准确率你得自己试下

liuxyon

May 1

建议增加编辑音频视频功能，例如要从一个长音频截取一个人的声纹，但是没有工具,需要另外找工具.

liuxyon

May 1

模型 2 智能身份识别不成功，全部都是一个人.

indexError

May 2 via Android

@liuxyon windows 端有啊声纹库，填写完基本信息后，点击加号

indexError

May 2 via Android

@liuxyon 你没录上声纹呢

liuxyon

May 2

@indexError 录了声纹，转文字还是很多错误,达不到使用

indexError

May 3

@liuxyon 如果你是纯方言，开源模型应该搞不定。另外有的不是错误，模型只负责把发音转为文本，但是不保证转为普通话文本。

liuxyon

May 3

不是纯方言,有口音，错误很大

indexError

May 3 via Android

@liuxyon 那就卸载了吧

indexError

May 15

5.22 号之前免费

已经下载的应该是自动获得正式版签名，没看懂后台的设置逻辑

windows 离线语音转文本、语音转文本、实时字幕工具

功能亮点

功能介绍