V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
287854442
1.32D
V2EX  ›  Joe's Talk 🪐

一个大胆的预言:语音输入将成为绝对主流

  •  1
     
  •   287854442 · 16 小时 51 分钟前 via Android · 7156 次点击

    先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。

    为什么?因为效率。

    一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。

    现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。

    当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。

    你觉得呢?

    第 1 条附言  ·  16 小时 8 分钟前
    为了避免歧义这里稍微补充一下这里所说的 “语音输入” 的含义:

    语音 -----AI-----> 文本

    就是现有很多输入法中的 按空格说话,然后用 AI 识别语音成文本,并不是 微信中的 发语音,这是两个事情, 后者也不需要预测了
    第 2 条附言  ·  6 小时 47 分钟前

    看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧

    慢慢来吧,时间会说明一切

    一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up

    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    JoeJoeJoe 打赏了 20 $V2EX
    180 条回复    2026-01-28 06:56:10 +08:00
    1  2  
    pweng286
        101
    pweng286  
       14 小时 37 分钟前
    我想植入脑机接口然后用意念输入.
    sorachi
        102
    sorachi  
       14 小时 37 分钟前
    语音输入不是一直都有吗?而且 mac 和 ios 自带的语音输入是完全可用的状态,不需要安装第三方输入法,而且免费。
    2en
        103
    2en  
       14 小时 36 分钟前
    公共场合怎么办,私人场合确实经常语音转文字,很方便
    chairuosen
        104
    chairuosen  
       14 小时 36 分钟前
    开车回复消息时发现,微信输入框右边多了一个语音输入,很方便
    Showfom
        105
    Showfom  
    PRO
       14 小时 36 分钟前 via iPhone
    不会的,不是所有人都喜欢说话,大多数人直接打字比说出来要轻松多了
    FlyaiF
        106
    FlyaiF  
    PRO
       14 小时 35 分钟前
    我只想到一个画面
    “别说话,吵到我用 TNT 了”
    dule
        107
    dule  
       14 小时 34 分钟前
    你在工位打字语音转换文字么?在公共场合基本不存在,多多少少涉及到个人隐私跟喧哗的问题。也就只有家里偶尔解放一下双手图方便
    287854442
        108
    287854442  
    OP
       14 小时 32 分钟前
    @JoeJoeJoe 难怪大家都说字体很好看,在电脑上确实是好看,手机上好像还是原字体,看不出来
    banmuyutian
        109
    banmuyutian  
       14 小时 31 分钟前
    你听过过罗永浩的 TNT 吗?
    JoeJoeJoe
        110
    JoeJoeJoe  
    PRO
       14 小时 31 分钟前
    @287854442 新功能 移动端适配估计还得往后靠靠
    njutree
        111
    njutree  
       14 小时 31 分钟前
    我也觉得语音输入还不如意念输入,最近马斯克的脑机接口不是很火嘛
    Krylo
        112
    Krylo  
       14 小时 30 分钟前
    @Krylo 骚话也不合适。
    例如:你开好房就去先吃饭然后上房洗干净在床上等我,套子我待会在路上买。你累了先睡下,今晚我饶不了你。
    287854442
        113
    287854442  
    OP
       14 小时 28 分钟前
    @Krylo 哈哈哈哈 兄弟太逗了 😂 AI 听了都脸红
    jackOff
        114
    jackOff  
       14 小时 27 分钟前
    首先要给手机设备升级,语音输入识别需要一定的模型和算力,当然如果有人不在意个人隐私全部走云上处理也可以,其次是降价,这样子就反直觉了,用户更倾向于使用离线语音识别输入法,但是又不想多花钱买高价格手机,那么最终市场上很可能出现一堆假装是离线语音识别的 app
    287854442
        115
    287854442  
    OP
       14 小时 26 分钟前
    @pweng286
    @njutree 乐观点看,可能也就 10-20 年后的事儿
    Dg3gWjbFvvq
        116
    Dg3gWjbFvvq  
       14 小时 21 分钟前
    就你标题里面的一大段话,使用 AI 语音输入法一气呵成吗?如果说了两句之后,觉得描述不对,怎么修改呢?用不用键盘?即使完全正确,如何处理同音字呢?比如说 尤其是人名相关的,如果 AI 识别为同音字,你是不是还要手动去修改?
    loryyang
        117
    loryyang  
       14 小时 11 分钟前
    语音输入最大的困难不在于语音本身,而是:别人也听得见
    要不搞一个腹语?唇语?或者,还是脑电波比较靠谱
    v3413
        118
    v3413  
       14 小时 6 分钟前
    讯飞为你点赞
    blank0ken
        119
    blank0ken  
       14 小时 3 分钟前
    有没有可能,输入的瓶颈不在打字速度,而在思考的速度
    287854442
        120
    287854442  
    OP
       14 小时 2 分钟前
    @Dg3gWjbFvvq 你试试,豆包输入法,一点问题都没有。
    leo72638
        121
    leo72638  
       13 小时 58 分钟前
    但是不想说话
    liubaicai
        122
    liubaicai  
       13 小时 53 分钟前
    你是罗桑的小号?
    0x663
        123
    0x663  
       13 小时 48 分钟前
    我就这么说吧,不是所有人的普通话都好。
    好多老表拼音都打错 发音掺杂着粤语(白话)音节
    Fish1024
        124
    Fish1024  
       13 小时 44 分钟前
    李姐万岁
    Meursau1T
        125
    Meursau1T  
       13 小时 43 分钟前
    我体验过豆包输入法,虽然自己现在主要还是手打输入,但不得不说,现在效率最高的方案确实是语音,只是难以解决公共场合的隐私问题。看其他论坛有人专门买了个 DJI 的麦,在工位上说悄悄话指导 AI 干活,用的也是 PC 豆包,感觉还挺有意思的。
    之前为了输入快一点,我折腾过很多,手机上练 17 键双拼,电脑上练小鹤音形,现在感觉慢慢会变成屠龙技。且不说语音的影响,纠错和词库的大力发展已经让这些手段成为明日黄花,除了能秀一手无上下文直接正确输入人名外没有什么好的。
    287854442
        126
    287854442  
    OP
       13 小时 39 分钟前
    @Meursau1T 这是真用过的, 很喜欢你的思考和留言
    nuomi196500
        127
    nuomi196500  
       13 小时 38 分钟前
    不可能。
    1.信息传递的重要考量因素之一是保密,绝大部分人在绝大多数时间里传递的信息不适合用语音念出来
    2.语音输入需要充分调动思考和语言系统,消耗的身体能量更多,不经济
    3.缺少文字输入中的思考缓冲优化过程,更容易导致言不达意,纠偏纠错成本太高
    4.环境兼容性较低,很多场景即使周围没人,其它声音也会极大影响输入准确率和效率
    5.声带很脆弱经不起消耗,大多数人可以连续打字几个小时,但几乎没人能持续说话几个小时
    287854442
        128
    287854442  
    OP
       13 小时 33 分钟前
    @nuomi196500 let's wait and see
    5200
        129
    5200  
       13 小时 32 分钟前
    语音在低噪、私密场景下效率是高的,但觉得不会是主流。
    终极形态可能还是意图直连,比如脑机接口,
    等做到戴副眼镜就能监控脑电波的无感输入,那才算质变。
    imsuxp
        130
    imsuxp  
       13 小时 30 分钟前
    是的 现在微信自带的语音输入也挺好的。
    bruce0
        131
    bruce0  
       13 小时 29 分钟前
    @NakeSnail #44 这部分确实忽略了,对 AI 下达指令,用语言输入确实方便,但是仅限于独处时.在公司场景中,语言输入基本不可能,先不说满办公室的人用语言输入的滑稽感,还可能被旁边的人影响到,还有摸鱼场景,比如我回复你这条就是在公司摸鱼时回复的,用语音输入,这不是旁边人都知道我再摸鱼了
    livib
        132
    livib  
       13 小时 29 分钟前
    你吵到我用 TNT 了
    doctorzry
        133
    doctorzry  
       13 小时 25 分钟前 via Android
    日常生活确实可以做到你说的这种情况,我现在跟别人聊天都很少打字了。豆包输入法真的 nb 。
    但是在很多工作场景,特别是 IT 这种行业,一句含两三个英文术语的,还是很难受。
    lonely701
        134
    lonely701  
       13 小时 19 分钟前 via iPhone
    最近非常有意思的一个讨论,就是说人是不是已经被键盘驯化、被纸和笔驯化成为在写作的时候的思想比说话的时候思想更加的流畅。另外一点我觉得语音是无法被替代的就是一些缩写和一些表情符号以及一个人在打字的时候,他会有一些特定的 pattern ,有一点点像说话时候的口癖。最简单的一点就是空格还是标点符号的使用,这个是语音输入无法去复刻的 character 。
    ooee2016
        135
    ooee2016  
       13 小时 15 分钟前
    @Hyxiao #85 一个月下来一算工资全给公司花了
    lostwolfkf
        136
    lostwolfkf  
       13 小时 14 分钟前
    打字别人不知道我打了啥,说话全世界都听到了
    ooee2016
        137
    ooee2016  
       13 小时 12 分钟前
    你这一大段文字, 你试试手打快, 还是语音转文字后再调整格式快. 你忘了手机还有'打电话'的功能吧.
    gabezhao
        138
    gabezhao  
       13 小时 12 分钟前
    @guqikang 李姐万岁!!!
    lonely701
        139
    lonely701  
       13 小时 12 分钟前 via iPhone
    @lonely701 开头不是“最近”应该是“这是”。现阶段语音识别错误率太高,尽管我已经纠正了很多,但还是漏了这一个。尤其是中文这种 tonal language 识别难度更高。当然英文德文的 conjugation 也是一大难点。

    我认为在即时通讯方面,语音转文字输入始终是一个替代,比如说在你手指受伤或做饭的时候。聊天对象还得是你不愿意发送纯语音的人,这种情况非常少。因为语音本身携带了非常多的 character 和 emotion ,打字时我们会用表情符号来传递,或者用一些缩写、暗语来跟非常亲密的朋友说一些可能只有你们才懂的梗。语音转文字会同时丢失语气中的信息以及表情符号带来的字里行间的信息。

    另一方面,在口述历史和个人回忆录撰写方面,以及访谈、会议记录等,语音转文字是非常必要的。
    wweerrgtc
        140
    wweerrgtc  
       13 小时 11 分钟前 via iPhone
    语音输入,我十年前想录一篇作文就用上了,那时候就识别很精准

    这十年过去了,语音输入还是没那么火
    ARFARFARF
        141
    ARFARFARF  
       13 小时 10 分钟前
    说话很容易结结巴巴,啰里啰唆
    marscosmo
        142
    marscosmo  
       13 小时 9 分钟前
    准确率他就是一个问题
    brom111
        143
    brom111  
       13 小时 8 分钟前
    我感觉并不会啊 朋友之间聊天还是以打字为主。 但是商业方面就不好说了。
    aikilan
        144
    aikilan  
       12 小时 44 分钟前
    用嘴表达最大的问题就是别人能听见,如果用嘴输入的话,当你在做一件具有思维挑战性的事儿要记得——“最好不要轻易的发表自己的观点,不然容易泄露自己是个笨蛋的事实”🤣
    udisyue
        145
    udisyue  
       12 小时 27 分钟前
    语音输入快是快,但是不可能完全代替手动输入。首先不是所有人发言都是一气呵成的,卡壳,经常加点嗯啊那个语气词太常见了,你要是一口气说八百字什么多余的都没有,普通人不可能。多余的文字,对阅读的人来说是极其难受的。
    然后就是除非你长期只有一个人在,否则语音对其他人一定有影响。
    xiayushengfan
        146
    xiayushengfan  
       12 小时 25 分钟前
    上班摸鱼用嘴,怕炒不到你
    maojun
        147
    maojun  
       12 小时 21 分钟前 via iPhone   ❤️ 1
    原来这么多人没有体验过现代的 ai 语音输入…跟楼里某些人的臆想完全不同,现在语音输入已经可以做到气声输入,中英混合输入,上下文推断,语音编辑和删改,自定义字典了,怎么还有以为语音输入就跟 iOS 里那个语音输入一样的😂
    maojun
        148
    maojun  
       12 小时 18 分钟前 via iPhone
    卡壳之类的问题 ai 也会自动优化掉,其实真没那么难用,我现在 Claude code 跑任务这样的场景还在键盘输入(因为没有 app 打通上下文,ai 理解不了我说的代码引用,比较难用),其余场景基本都切换到语音了
    xiangyuecn
        149
    xiangyuecn  
       12 小时 15 分钟前
    你要不先打个 10086 试试
    homitseng
        150
    homitseng  
       12 小时 14 分钟前
    只在京东大量写评论的时候才会用语音输入
    287854442
        151
    287854442  
    OP
       12 小时 12 分钟前 via Android
    @maojun 我跟你一样吃惊
    lumia1020
        152
    lumia1020  
       12 小时 11 分钟前
    这个的确是一种高效的方式。但能否成为主流,这个不好说。我之前也用过语音输入,觉得准确率和效率满意,但还是习惯敲键盘输入。有独立办公室可以随便说话的人,一般不需要高效输入大量文字。
    Jet
        153
    Jet  
       11 小时 59 分钟前
    彪盖在上个世纪就预言过了。
    iixy
        154
    iixy  
       11 小时 56 分钟前
    这也太大胆了,好佩服好震惊,我从没想过世界会发展成这样,你好棒棒
    Felldeadbird
        155
    Felldeadbird  
       11 小时 32 分钟前
    楼主你想想,你施放魔法时,要咏唱。会不会羞耻。

    反正我不喜欢说话的,办公室也是很安静。
    andyxq
        156
    andyxq  
       11 小时 17 分钟前
    PC 已经在用了。装的闪电说,识别速度很快,准确率也很高
    w2er
        157
    w2er  
       11 小时 12 分钟前
    未来,不是属于脑波交流,意念传音嘛。我这一代不知道能不能赶上,但是不会超过百年
    287854442
        158
    287854442  
    OP
       10 小时 53 分钟前
    @andyxq 我要去试一下,我用的 Wiserflow ,吹上天了,用下来还不如免费的豆包。。。


    @w2er 估计 10-20 年应该有戏
    kkwa56188
        159
    kkwa56188  
       10 小时 43 分钟前
    浪费我一分钟, op 在地铁上还是在高铁上语音输入转成文字发的这个帖子?
    MoneyIsKing
        160
    MoneyIsKing  
       10 小时 42 分钟前
    确实是这样,目前在使用 spokenly ,本地模型体验感一般般,期待更好的模型
    yufeng0681
        161
    yufeng0681  
       10 小时 0 分钟前   ❤️ 1
    语音输入,格局低了。
    语音交互, 不要手指点点点了,直接语音就能完成大部分的 app 交互,完成大多数的特定任务。
    287854442
        162
    287854442  
    OP
       9 小时 57 分钟前
    @yufeng0681 这是我今天看到的最好的回复之一, 我喜欢你这个评论, 很有启发性
    rick13
        163
    rick13  
       9 小时 56 分钟前
    我在大街上发微信就是用语音输入,现在微信内置了语音输入,识别率挺高的
    Eagleyes
        164
    Eagleyes  
       9 小时 52 分钟前
    不可能,其实目前语音输入准确率已经很高。。

    但是,大家在格子间里不是啪啪打字而是侃侃而谈(语音输入)是一种什么体验?烦死了。
    newtype0092
        165
    newtype0092  
       9 小时 51 分钟前
    你看看新闻,人家前沿都在搞脑机接口,语音输入都是玩剩下的东西了。
    Lemonadeccc
        166
    Lemonadeccc  
       9 小时 33 分钟前
    语言转文字这个东西,16 17 年那些手机上的打字软件就有了= =
    BadAngel
        167
    BadAngel  
       9 小时 12 分钟前
    直接脑机输入了,还语音干嘛?
    solecc
        168
    solecc  
       8 小时 28 分钟前
    普通话不标准的时候不太准确
    kassadin
        169
    kassadin  
       7 小时 48 分钟前
    我以为这已经快是共识了…
    weiwenhao
        170
    weiwenhao  
       7 小时 45 分钟前
    我感觉我打字表达的更加清晰准确,速度也不慢。不过骂 AI 的话还是语音输入比较好。
    oamu
        171
    oamu  
       7 小时 31 分钟前
    对于大多数人来说,输入速度并不是瓶颈,思维才是,要达到 160 ~ 240 字每分钟的速度,相当于进行流畅的即兴演讲,很难的。此外,一般人一次也讲不了多久,讲个四五十分钟就口干舌燥了。所以,所谓的“效率”可能只在某些场景成立。
    simonzhang0207
        172
    simonzhang0207  
       7 小时 25 分钟前 via Android
    罗老师的 tnt 还是太超前了🤣
    laminux29
        173
    laminux29  
       7 小时 21 分钟前
    楼上有太多石器时代的人了。语音输入当然是未来,因为输入性能比手敲键盘快上一个数量级,楼上的老古董们没体验过语音输入、太把自己当回事了。

    1.说保密与隐私,你用的输入法是开源的吗?但凡不是开源的,你觉得这玩意保密?

    2.说公共场合不适合语音输入,难道公共场合不让说话了?语音输入又不需要你喊出来,小声说话也完全可以进行语音输入。

    3.未来的编程是自然语音进行流程结构控制,语音输入当然能行,你以为未来的编程还是用编程语言+标点符号?

    语音输入为什么是未来?你仔细思考一下,如果一个技术对接讨论会,大家都不说话,都用文字输入,那么一场一个小时的会议,时间会翻几倍?
    287854442
        174
    287854442  
    OP
       7 小时 14 分钟前
    @laminux29 哈哈哈哈,兄弟是明白人。看留言就发现很多人还停留在过去的思维,用旧思维看新事物很难准确(让我想到:慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧 )慢慢来吧,时间会说明一切。前阵子学到一句话叫 “不要干涉他人因果”,挺好。
    Hyvi
        175
    Hyvi  
       6 小时 32 分钟前
    至少从我的角度来看,会替代文字输入
    trn4
        176
    trn4  
       5 小时 10 分钟前
    一秒 3-4 个字,你这不是在表达,你这是在快速朗读
    Revenant
        177
    Revenant  
       3 小时 24 分钟前
    语音和手写输入并不冲突,我认为未来趋势应该是不同场景相互协作的,比如软件开发领域偏手打为主,语音为辅助,对文字准确度要求不那么高的场景,比如记日记,通过语音给 AI 提各种要求,应该是语音为主,手打为辅助
    maolon
        178
    maolon  
       1 小时 45 分钟前
    这不是一个场景,我打字的时候我其实在脑子里在思考和调整思路和逻辑,并且很方便的来回修改,语音你再依赖 ai 语义理解,你在思路都没想好就说也说不出个什么所以然来,这不是准确度的问题而是使用习惯的问题
    levelworm
        179
    levelworm  
       1 小时 20 分钟前
    对于日常交流来说,直接语音交流就行了,没必要转过去输入。对于写代码来说,也没办法代替。我觉得语音输入最好的应用场合还是比较有限。
    forisra
        180
    forisra  
       46 分钟前
    语音输入太尴尬了。
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1248 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 23:42 · PVG 07:42 · LAX 15:42 · JFK 18:42
    ♥ Do have faith in what you're doing.