适用于看外语视频、直播之类的场景,
不过我个人一般是用来看 Twitch 直播和听 ASMR
项目地址: https://github.com/TheDeathDragon/LiveTranslate
也有视频演示效果,地址: https://www.bilibili.com/video/BV1jQwgzLEjU/
虽然没有商业应用这么准确,但是看个大概还是可以的。
模型的话,推荐用阿里云的 qwen-turbo-latest 速度快,相对准确
以下为截图:


1
zzz22333 4 天前
看着不错,不过有试过 Gemini live 的接口么?
|
2
caola 4 天前
看着不错+1 ,可以弄成字幕方式显示最好,类似于酷狗音乐的歌词单行字幕,调整对应显示的大小和屏幕位置后自动隐藏软件本身,相当于悬浮在视频或屏幕上面显示字幕
|
3
MiraiWithRin OP @caola 这个设计之初就考虑不是和字幕一样的,再快还是有两三秒延迟,就和直播间一样的感觉,窗口就只有悬浮窗,然后有个托盘,悬浮窗可以前台置顶的,位置也可以随便拖动,大小颜色都可以设置里面调整
|
4
MiraiWithRin OP @zzz22333 还没有测试过,目前都是用的 OpenAI 标准
|
5
hanguofu 3 天前 via Android
qwen-turbo-latest 是怎样计价的啊?
|
6
MiraiWithRin OP @hanguofu 看了几个小时直播都没用到五毛钱,用免费的模型额度都完全足够了,但是 qwen-turbo-latest 没有免费额度,其他模型响应基本要 1 秒以上
|
7
afkool 3 天前
先星一下。。这个比 CHROME 自带的识别率高一些。
|