完全本地推理与存储,不依赖网络
不依赖 GPU ,CPU 速度飞快
CPU 飞快
i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )
i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )
实时识别
支持识别麦克风、系统声音或者双路同时识别。
支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)
识别音视频文件
支持主流音视频文件。
内置 FFMpeg 处理,可以转换各种格式。
说话人管理
内置说话人管理
可以为每个说话人指定模型进行识别
强大的编辑与搜索功能
支持自定义词典。自动调用词典内容进行后处理。
支持手动编辑,点击识别文本自动跳转到对应音频。
支持批量删除与替换
支持全局搜索
本地 LLM 支持
内置 ollama 接口,支持一键启动,一键处理。
可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务
语言支持
1
testliyu Apr 29
用的 parafomer 模型么
|
2
indexError OP @testliyu 没 一共四个模型 qwen sensevoice parakeet firered
|
3
testliyu Apr 29
@indexError 这个模型是你微调过的么
|
4
testliyu Apr 29
@indexError 1.8B 模型 CPU 推理有这么快的转录比么
|
5
indexError OP @testliyu 1.8b 的模型是用来翻译的,我上面的速度是转录速度,不包含大模型处理。
|
6
testliyu Apr 29
@indexError #5 好的 已下载 支持下
|
7
liuxyon Apr 29
测试了安卓端 转文字还是错误比较多,速度挺快
|
8
indexError OP @liuxyon 安卓用的是 sensevoice int8 ,参数量比较小。在普通话准确率上,速度快的没他准,准确率高的没他快。大部分本地部署的都会接入这个模型。
|
9
liuxyon Apr 29
含有一些陕西方言的哪个能准?
|
10
indexError OP @liuxyon windows 版试下 模型 2 和 模型 4 ,这俩都支持多地区中文方言,准确率你得自己试下
|
11
liuxyon 3 days ago
建议增加编辑音频 视频功能,例如要从一个长音频截取一个人的声纹,但是没有工具,需要另外找工具.
|
12
liuxyon 3 days ago
模型 2 智能 身份识别不成功,全部都是一个人.
|
13
indexError OP @liuxyon windows 端有啊 声纹库,填写完基本信息后,点击加号
|
14
indexError OP @liuxyon 你没录上声纹呢
|
15
liuxyon 2 days ago
@indexError 录了声纹,转文字还是很多错误,达不到使用
|
16
indexError OP @liuxyon 如果你是纯方言,开源模型应该搞不定。另外有的不是错误,模型只负责把发音转为文本,但是不保证转为普通话文本。
|
17
liuxyon 2 days ago
不是纯方言,有口音,错误很大
|
18
indexError OP @liuxyon 那就卸载了吧
|