V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  pimou  ›  全部回复第 1 页 / 共 5 页
回复总数  84
1  2  3  4  5  
15 天前
回复了 huazi1889 创建的主题 分享创造 开源个小工具——多语言翻译生成
这个有用, 最近想着没有就自己写一个。 有两个建议:1. 增加其他的大模型接口配置,最好是让自己配置 url 、模型名称.
2. 选择语言那里, 上面部分用同一个本地化语言显示。 比如界面是中文, 就全部用汉字显示。 像现在这样,也看不懂。
看看你有没有计划来改。 不然我就拉下来自己改了( doge
@Vitta #28 主要我没有 intel 的电脑。 没办法验证库的兼容性。
24 天前
回复了 vegetablebird 创建的主题 Windows Windows 平台语音实时转文字解决方案?
可以看下 DuRT ,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本、保存翻译结果。

DuRT 的实时语音识别有两种方式。 一种是使用 Mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。
翻译用的是大模型。 支持在本地运行大模型 和使用云端的大模型 API 。
可以看下,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本、保存翻译结果。

DuRT 的实时语音识别有两种方式。 一种是使用 Mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。
翻译用的是大模型。 支持在本地运行大模型 和使用云端的大模型 API 。
24 天前
回复了 maxthon 创建的主题 macOS 有没有 系统声音转文字 并记录 的软件
可以看下,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809?mt=12

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本、保存翻译结果。

DuRT 的实时语音识别有两种方式。 一种是使用 Mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。DuRT 语音识别有两种方式。 一种是使用 mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。
翻译用的是大模型。 支持在本地和使用云端的大模型 API 。
你所讲的声音从 mac 扬声器, 是指,来源是系统的音频吗。

可以看下,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809?mt=12

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本。

DuRT 语音识别有两种方式。 一种是使用 mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。 都不需要使用云端的付费接口。
24 天前
回复了 Chism 创建的主题 macOS macOS 有系统声音语音转文字工具吗?
可以看下,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809?mt=12

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本。

DuRT 语音识别有两种方式。 一种是使用 mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。 不需要使用云端的付费接口。
24 天前
回复了 OrangeAdd 创建的主题 问与答 有 PC 端英文语音识别软件推荐吗?
自荐下。 DuRT 是 Mac 上的实时语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809?mt=12

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本。
自荐下。 DuRT 是 mac 上的实时语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809?mt=12
目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本。
识别使用的是本地模型,不需要使用云端的 API 。
歪个楼。 自荐下。 DuRT 是 mac 上的实时语音识别和翻译软件。 可以满足你的需求。
目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本。
还挺有意思的。
105 天前
回复了 EVJohn 创建的主题 职场话题 关于最近的创业白嫖贴,建议老板签对赌
对赌没用。 如果连基本工资都不给,还指望能履行协议。
程序员的 KPI 都是怎么算的,按功能点、修 bug 数,还是其他什么
JSON For You 代码是抄袭 JSON CRACK 吗,还是只是功能相似。 看对方也是开源项目。 两个项目的差异性在哪里呢。价格一样,对方还有先发优势。
有项目能把之前失效的视频找到吗
@CaptainD #55 512 省着点还马马虎虎,256 是真恶心人
206 天前
回复了 daqing 创建的主题 分享创造 关于聊天软件的后续来了(最新进展)
@daqing #9 色情内容过滤?那更不会用了
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2982 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 03:00 · PVG 11:00 · LAX 20:00 · JFK 23:00
Developed with CodeLauncher
♥ Do have faith in what you're doing.