V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
f1ynnv2
V2EX  ›  输入法

这两天试用了几个语音输入法,最后选择了闪电说。

  •  
  •   f1ynnv2 · 12 天前 · 1164 次点击
    简单说明一下近期试用的几个语音输入法,最先用的是 Typeless ,这个输入效果可以说是目前所有语音输入法里面效果最好的,尤其是中英文混输。而且让我特别震惊的是,我说的一些夹带的一些行业里老外的名字居然全也能识别对了。另外这软件从完成度来说各种细节非常完善,到目前为止都没遇到什么不爽的地方。唯一美中不足的可能就是两点,一是年费太贵,每个月 12 刀,还是挺肉疼的。第二个是它不太适合用来日常聊天,AI 味太重,当然用来 Vibe coding 是最合适的了。

    其次是闪电说/Lazytyper/Sayso 这类支持 SenseVoce Small 本地模型 + 各种在线语音识别模型包括 LLM 的后起之秀。因为都是调用相同的模型,我猜表现应该都差不多,为什么说我猜呢?因为我只跑起来了闪电说和 Sayso 两个,Sayso 印象不太记得了好像用着不顺手就卸载了。

    闪电说先用了本地模型,响应很快,感觉也够用,但是使用本地模型的时候要占用 800M 左右的内存,使用在线模型(我使用的是豆包流式 2.0+seed 2.0 lite)只占用不超过 50M 内存。所以这类输入法其实挺有优势的,在网络不佳的地方可以临时用离线模型应对,网络好的地方使用在线模型省内存就等于省电。而且对于注重隐私的人来说,可以完全使用本地模型。闪电说比较令人诟病的是不能关闭语音助手,感觉很鸡肋的功能(我猜后面可能会往这块里面加增值功能吧,所以强推)。另外闪电说和很多国产软件一样,主要功能强大+细节有待打磨。比如多屏的时候经常不显示语音提示框,语音识别吞首字等等。感觉这些都是些小问题,就看开发者是否能及时修复了。

    Lazytyper 试了半天也没下载成功 SenseVoice 模型就放弃了,想添加豆包模型试试也一直报错(奇怪的是相同的 appid 和 token 在闪电说里就正常),如果配置好模型我觉得应该和闪电说类似吧。不过简短试用的时候发现 Lazytyper 无法绑定 Fn + Space 组合键,这也是让我直接放弃进一步尝试的原因。 因为我用的京造键盘上有一个语音输入键,就是绑定的 Fn + Sapce 键,可以无缝绑定到 Typeless 、闪电说,但是就是绑定不到 Lazytyper 上。

    另外还试用了 AutoGLM ,整体来说中文识别效果不错,但是中英文混合识别不太行,明显不如豆包流式识别 2.0 。另外之前是能绑定 Fn + Sapce 组合键的但是会存在个小 bug 就是按下语音输入键(实际上就是这两个组合键)会立刻输入一个空格,所以每次用 AutoGLM 语入的时候,在开头和结尾都会有一个多余的空格。。群里给 AutoGLM 反馈了这个问题,他们发了个新版本解决了,解决的办法是禁止绑定 Fn+Space 组合键。。。。我????于是就卸载了 AutoGLM

    最近几天也高频的使用了 macOS 上微信的语音输入,尤其是看到它支持跨窗口的语音识别,还着实兴奋了一会,觉得可以不用安装其他语音输入法了,直接用微信的就行。但这两天实际使用下来,发现它只在纯中文,而且是比较短的内容识别的时候效果还可以。一旦输入大段或者是几段文字,就会有很多词是错误的。你基本上要回去改个五六处才能发出去,这样就感觉效率非常低了,感觉比 autoglm 和闪电说都差很大一些,更不用说和 typeless 相比了。如果是再夹杂着英文,那简直就是灾难。所以我的感觉微信这个只适合简短的聊天的时候使用吧。和上面其他输入法感觉完全不是同一个水平的。

    我最后的选择是使用闪电说,然后用豆包的大语言流式识别 2.0 模型。优势是有的时候笔记本在外面网络不好的时候可以用离线模型,但大部分时间就可以直接用豆包的这个语音识别模型。豆包的这个语音识别模型应该是公认的中文效果最好的,虽然中英文输入还有待提高。另外,闪电说结合 Karabiner-Elements 可以把苹果键盘的 Dictation 语音输入键映射到 FN ,然后直接使用这个键来控制语音识别,用起来还挺方便的。
    12 条回复    2026-03-10 14:38:53 +08:00
    coffeesun
        1
    coffeesun  
       12 天前 via Android
    这种最终会联网的,即便用的是离线,我担心的是只要最终联网,仍会把所有以往记录上传,因为毕竟文字占用很小,加个密上传,谁能知道呢
    root71370
        2
    root71370  
       12 天前 via Android
    豆包输入法发语音是真的很强
    billytom
        3
    billytom  
       11 天前
    语音输入+大模型输入都用国内的 AI ,你们也真是敢。。。

    到时候注册手机号+个人记忆一关联,它比你妈你老婆你自己都懂你
    signal
        4
    signal  
       11 天前
    我一直用的 LazyTyper 直接本地模型很爽的
    oldcai
        5
    oldcai  
    PRO
       11 天前
    @billytom LazyTyper 支持好几个本地 ASR 模型,和好几个国外有数据法律合规的 API 提供商。

    支持 Fn 作为快捷键,还支持鼠标,甚至蓝牙耳机播放键都可以作为快捷键 🐶
    f1ynnv2
        6
    f1ynnv2  
    OP
       11 天前
    @oldcai 是的 LazyTyper 支持的离线模型非常丰富,可能是我没点对地方,都下载不成功。 快捷键看起来也很丰富,甚至支持鼠标按键绑定,但是键盘上的组合键如果能绑定 Fn+Space 就好了。
    locoz
        7
    locoz  
       11 天前 via Android
    闪电说有一点比较烦,就是它没有办法接自己部署的其他模型,只能用它自己集成那个,或者就是选择特定的线上模型。但实际上我感觉我自己部署那个千问三 TTS 的效果是挺好的,准确度会比它自己集成那个高很多,面对嘈杂环境的场景,效果也更好。
    f1ynnv2
        8
    f1ynnv2  
    OP
       11 天前
    locoz
        9
    locoz  
       11 天前 via Android
    @f1ynnv2 #8 我的意思是闪电说他没有办法去设置使用自己部署的模型。哦前面还说错了,是千问的 ASR ,不是 TTS 。
    Astralume
        10
    Astralume  
       11 天前 via iPhone
    再等豆包的 Mac 版本好久了,什么时候能出啊,我就抛弃其他语音输入法了😄
    slackerman
        11
    slackerman  
       2 天前
    Thank you for your sharing.This message is from Typeless.
    slackerman
        12
    slackerman  
       2 天前
    对了,装了 Windows 的输入法,会像安卓一样随便拖剪贴板的东西吗?这个可非常危险
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   995 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 19:41 · PVG 03:41 · LAX 12:41 · JFK 15:41
    ♥ Do have faith in what you're doing.