先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。
为什么?因为效率。
一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。
现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。
当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。
你觉得呢?
看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧
慢慢来吧,时间会说明一切
一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up
101
pweng286 14 小时 37 分钟前
我想植入脑机接口然后用意念输入.
|
102
sorachi 14 小时 37 分钟前
语音输入不是一直都有吗?而且 mac 和 ios 自带的语音输入是完全可用的状态,不需要安装第三方输入法,而且免费。
|
103
2en 14 小时 36 分钟前
公共场合怎么办,私人场合确实经常语音转文字,很方便
|
104
chairuosen 14 小时 36 分钟前
开车回复消息时发现,微信输入框右边多了一个语音输入,很方便
|
105
Showfom PRO 不会的,不是所有人都喜欢说话,大多数人直接打字比说出来要轻松多了
|
106
FlyaiF PRO 我只想到一个画面
“别说话,吵到我用 TNT 了” |
107
dule 14 小时 34 分钟前
你在工位打字语音转换文字么?在公共场合基本不存在,多多少少涉及到个人隐私跟喧哗的问题。也就只有家里偶尔解放一下双手图方便
|
109
banmuyutian 14 小时 31 分钟前
你听过过罗永浩的 TNT 吗?
|
111
njutree 14 小时 31 分钟前
我也觉得语音输入还不如意念输入,最近马斯克的脑机接口不是很火嘛
|
114
jackOff 14 小时 27 分钟前
首先要给手机设备升级,语音输入识别需要一定的模型和算力,当然如果有人不在意个人隐私全部走云上处理也可以,其次是降价,这样子就反直觉了,用户更倾向于使用离线语音识别输入法,但是又不想多花钱买高价格手机,那么最终市场上很可能出现一堆假装是离线语音识别的 app
|
116
Dg3gWjbFvvq 14 小时 21 分钟前
就你标题里面的一大段话,使用 AI 语音输入法一气呵成吗?如果说了两句之后,觉得描述不对,怎么修改呢?用不用键盘?即使完全正确,如何处理同音字呢?比如说 尤其是人名相关的,如果 AI 识别为同音字,你是不是还要手动去修改?
|
117
loryyang 14 小时 11 分钟前
语音输入最大的困难不在于语音本身,而是:别人也听得见
要不搞一个腹语?唇语?或者,还是脑电波比较靠谱 |
118
v3413 14 小时 6 分钟前
讯飞为你点赞
|
119
blank0ken 14 小时 3 分钟前
有没有可能,输入的瓶颈不在打字速度,而在思考的速度
|
120
287854442 OP @Dg3gWjbFvvq 你试试,豆包输入法,一点问题都没有。
|
121
leo72638 13 小时 58 分钟前
但是不想说话
|
122
liubaicai 13 小时 53 分钟前
你是罗桑的小号?
|
123
0x663 13 小时 48 分钟前
我就这么说吧,不是所有人的普通话都好。
好多老表拼音都打错 发音掺杂着粤语(白话)音节 |
124
Fish1024 13 小时 44 分钟前
李姐万岁
|
125
Meursau1T 13 小时 43 分钟前
我体验过豆包输入法,虽然自己现在主要还是手打输入,但不得不说,现在效率最高的方案确实是语音,只是难以解决公共场合的隐私问题。看其他论坛有人专门买了个 DJI 的麦,在工位上说悄悄话指导 AI 干活,用的也是 PC 豆包,感觉还挺有意思的。
之前为了输入快一点,我折腾过很多,手机上练 17 键双拼,电脑上练小鹤音形,现在感觉慢慢会变成屠龙技。且不说语音的影响,纠错和词库的大力发展已经让这些手段成为明日黄花,除了能秀一手无上下文直接正确输入人名外没有什么好的。 |
127
nuomi196500 13 小时 38 分钟前
不可能。
1.信息传递的重要考量因素之一是保密,绝大部分人在绝大多数时间里传递的信息不适合用语音念出来 2.语音输入需要充分调动思考和语言系统,消耗的身体能量更多,不经济 3.缺少文字输入中的思考缓冲优化过程,更容易导致言不达意,纠偏纠错成本太高 4.环境兼容性较低,很多场景即使周围没人,其它声音也会极大影响输入准确率和效率 5.声带很脆弱经不起消耗,大多数人可以连续打字几个小时,但几乎没人能持续说话几个小时 |
128
287854442 OP @nuomi196500 let's wait and see
|
129
5200 13 小时 32 分钟前
语音在低噪、私密场景下效率是高的,但觉得不会是主流。
终极形态可能还是意图直连,比如脑机接口, 等做到戴副眼镜就能监控脑电波的无感输入,那才算质变。 |
130
imsuxp 13 小时 30 分钟前
是的 现在微信自带的语音输入也挺好的。
|
131
bruce0 13 小时 29 分钟前
@NakeSnail #44 这部分确实忽略了,对 AI 下达指令,用语言输入确实方便,但是仅限于独处时.在公司场景中,语言输入基本不可能,先不说满办公室的人用语言输入的滑稽感,还可能被旁边的人影响到,还有摸鱼场景,比如我回复你这条就是在公司摸鱼时回复的,用语音输入,这不是旁边人都知道我再摸鱼了
|
132
livib 13 小时 29 分钟前
你吵到我用 TNT 了
|
133
doctorzry 13 小时 25 分钟前 via Android
日常生活确实可以做到你说的这种情况,我现在跟别人聊天都很少打字了。豆包输入法真的 nb 。
但是在很多工作场景,特别是 IT 这种行业,一句含两三个英文术语的,还是很难受。 |
134
lonely701 13 小时 19 分钟前 via iPhone
最近非常有意思的一个讨论,就是说人是不是已经被键盘驯化、被纸和笔驯化成为在写作的时候的思想比说话的时候思想更加的流畅。另外一点我觉得语音是无法被替代的就是一些缩写和一些表情符号以及一个人在打字的时候,他会有一些特定的 pattern ,有一点点像说话时候的口癖。最简单的一点就是空格还是标点符号的使用,这个是语音输入无法去复刻的 character 。
|
136
lostwolfkf 13 小时 14 分钟前
打字别人不知道我打了啥,说话全世界都听到了
|
137
ooee2016 13 小时 12 分钟前
你这一大段文字, 你试试手打快, 还是语音转文字后再调整格式快. 你忘了手机还有'打电话'的功能吧.
|
139
lonely701 13 小时 12 分钟前 via iPhone
@lonely701 开头不是“最近”应该是“这是”。现阶段语音识别错误率太高,尽管我已经纠正了很多,但还是漏了这一个。尤其是中文这种 tonal language 识别难度更高。当然英文德文的 conjugation 也是一大难点。
我认为在即时通讯方面,语音转文字输入始终是一个替代,比如说在你手指受伤或做饭的时候。聊天对象还得是你不愿意发送纯语音的人,这种情况非常少。因为语音本身携带了非常多的 character 和 emotion ,打字时我们会用表情符号来传递,或者用一些缩写、暗语来跟非常亲密的朋友说一些可能只有你们才懂的梗。语音转文字会同时丢失语气中的信息以及表情符号带来的字里行间的信息。 另一方面,在口述历史和个人回忆录撰写方面,以及访谈、会议记录等,语音转文字是非常必要的。 |
140
wweerrgtc 13 小时 11 分钟前 via iPhone
语音输入,我十年前想录一篇作文就用上了,那时候就识别很精准
这十年过去了,语音输入还是没那么火 |
141
ARFARFARF 13 小时 10 分钟前
说话很容易结结巴巴,啰里啰唆
|
142
marscosmo 13 小时 9 分钟前
准确率他就是一个问题
|
143
brom111 13 小时 8 分钟前
我感觉并不会啊 朋友之间聊天还是以打字为主。 但是商业方面就不好说了。
|
144
aikilan 12 小时 44 分钟前
用嘴表达最大的问题就是别人能听见,如果用嘴输入的话,当你在做一件具有思维挑战性的事儿要记得——“最好不要轻易的发表自己的观点,不然容易泄露自己是个笨蛋的事实”🤣
|
145
udisyue 12 小时 27 分钟前
语音输入快是快,但是不可能完全代替手动输入。首先不是所有人发言都是一气呵成的,卡壳,经常加点嗯啊那个语气词太常见了,你要是一口气说八百字什么多余的都没有,普通人不可能。多余的文字,对阅读的人来说是极其难受的。
然后就是除非你长期只有一个人在,否则语音对其他人一定有影响。 |
146
xiayushengfan 12 小时 25 分钟前
上班摸鱼用嘴,怕炒不到你
|
147
maojun 12 小时 21 分钟前 via iPhone 原来这么多人没有体验过现代的 ai 语音输入…跟楼里某些人的臆想完全不同,现在语音输入已经可以做到气声输入,中英混合输入,上下文推断,语音编辑和删改,自定义字典了,怎么还有以为语音输入就跟 iOS 里那个语音输入一样的😂
|
148
maojun 12 小时 18 分钟前 via iPhone
卡壳之类的问题 ai 也会自动优化掉,其实真没那么难用,我现在 Claude code 跑任务这样的场景还在键盘输入(因为没有 app 打通上下文,ai 理解不了我说的代码引用,比较难用),其余场景基本都切换到语音了
|
149
xiangyuecn 12 小时 15 分钟前
你要不先打个 10086 试试
|
150
homitseng 12 小时 14 分钟前
只在京东大量写评论的时候才会用语音输入
|
152
lumia1020 12 小时 11 分钟前
这个的确是一种高效的方式。但能否成为主流,这个不好说。我之前也用过语音输入,觉得准确率和效率满意,但还是习惯敲键盘输入。有独立办公室可以随便说话的人,一般不需要高效输入大量文字。
|
153
Jet 11 小时 59 分钟前
彪盖在上个世纪就预言过了。
|
154
iixy 11 小时 56 分钟前
这也太大胆了,好佩服好震惊,我从没想过世界会发展成这样,你好棒棒
|
155
Felldeadbird 11 小时 32 分钟前
楼主你想想,你施放魔法时,要咏唱。会不会羞耻。
反正我不喜欢说话的,办公室也是很安静。 |
156
andyxq 11 小时 17 分钟前
PC 已经在用了。装的闪电说,识别速度很快,准确率也很高
|
157
w2er 11 小时 12 分钟前
未来,不是属于脑波交流,意念传音嘛。我这一代不知道能不能赶上,但是不会超过百年
|
159
kkwa56188 10 小时 43 分钟前
浪费我一分钟, op 在地铁上还是在高铁上语音输入转成文字发的这个帖子?
|
160
MoneyIsKing 10 小时 42 分钟前
确实是这样,目前在使用 spokenly ,本地模型体验感一般般,期待更好的模型
|
161
yufeng0681 10 小时 0 分钟前 语音输入,格局低了。
语音交互, 不要手指点点点了,直接语音就能完成大部分的 app 交互,完成大多数的特定任务。 |
162
287854442 OP @yufeng0681 这是我今天看到的最好的回复之一, 我喜欢你这个评论, 很有启发性
|
163
rick13 9 小时 56 分钟前
我在大街上发微信就是用语音输入,现在微信内置了语音输入,识别率挺高的
|
164
Eagleyes 9 小时 52 分钟前
不可能,其实目前语音输入准确率已经很高。。
但是,大家在格子间里不是啪啪打字而是侃侃而谈(语音输入)是一种什么体验?烦死了。 |
165
newtype0092 9 小时 51 分钟前
你看看新闻,人家前沿都在搞脑机接口,语音输入都是玩剩下的东西了。
|
166
Lemonadeccc 9 小时 33 分钟前
语言转文字这个东西,16 17 年那些手机上的打字软件就有了= =
|
167
BadAngel 9 小时 12 分钟前
直接脑机输入了,还语音干嘛?
|
168
solecc 8 小时 28 分钟前
普通话不标准的时候不太准确
|
169
kassadin 7 小时 48 分钟前
我以为这已经快是共识了…
|
170
weiwenhao 7 小时 45 分钟前
我感觉我打字表达的更加清晰准确,速度也不慢。不过骂 AI 的话还是语音输入比较好。
|
171
oamu 7 小时 31 分钟前
对于大多数人来说,输入速度并不是瓶颈,思维才是,要达到 160 ~ 240 字每分钟的速度,相当于进行流畅的即兴演讲,很难的。此外,一般人一次也讲不了多久,讲个四五十分钟就口干舌燥了。所以,所谓的“效率”可能只在某些场景成立。
|
172
simonzhang0207 7 小时 25 分钟前 via Android
罗老师的 tnt 还是太超前了🤣
|
173
laminux29 7 小时 21 分钟前
楼上有太多石器时代的人了。语音输入当然是未来,因为输入性能比手敲键盘快上一个数量级,楼上的老古董们没体验过语音输入、太把自己当回事了。
1.说保密与隐私,你用的输入法是开源的吗?但凡不是开源的,你觉得这玩意保密? 2.说公共场合不适合语音输入,难道公共场合不让说话了?语音输入又不需要你喊出来,小声说话也完全可以进行语音输入。 3.未来的编程是自然语音进行流程结构控制,语音输入当然能行,你以为未来的编程还是用编程语言+标点符号? 语音输入为什么是未来?你仔细思考一下,如果一个技术对接讨论会,大家都不说话,都用文字输入,那么一场一个小时的会议,时间会翻几倍? |
174
287854442 OP @laminux29 哈哈哈哈,兄弟是明白人。看留言就发现很多人还停留在过去的思维,用旧思维看新事物很难准确(让我想到:慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧 )慢慢来吧,时间会说明一切。前阵子学到一句话叫 “不要干涉他人因果”,挺好。
|
175
Hyvi 6 小时 32 分钟前
至少从我的角度来看,会替代文字输入
|
176
trn4 5 小时 10 分钟前
一秒 3-4 个字,你这不是在表达,你这是在快速朗读
|
177
Revenant 3 小时 24 分钟前
语音和手写输入并不冲突,我认为未来趋势应该是不同场景相互协作的,比如软件开发领域偏手打为主,语音为辅助,对文字准确度要求不那么高的场景,比如记日记,通过语音给 AI 提各种要求,应该是语音为主,手打为辅助
|
178
maolon 1 小时 45 分钟前
这不是一个场景,我打字的时候我其实在脑子里在思考和调整思路和逻辑,并且很方便的来回修改,语音你再依赖 ai 语义理解,你在思路都没想好就说也说不出个什么所以然来,这不是准确度的问题而是使用习惯的问题
|
179
levelworm 1 小时 20 分钟前
对于日常交流来说,直接语音交流就行了,没必要转过去输入。对于写代码来说,也没办法代替。我觉得语音输入最好的应用场合还是比较有限。
|
180
forisra 46 分钟前
语音输入太尴尬了。
|