比如一堆英文字符:adsokfjja asdffsa ffff iphone djkff walk dfasfasf
那么我就提取出 iphone 和 walk 这两个单词,有这方面的 api 吗?
1
tionsin Jan 24, 2019
需求不明确
|
2
jrient Jan 24, 2019
按空格切割字符串,然后找个翻译软件的 api,逐词翻译。无释义的多半不是单词。
应该不难,自己搞个。 |
3
TimePPT PRO 从牛津高阶啊朗文之类的词典里整理个词表也就几十万单词,源数据整理完 uniq,硬匹配就行。对未匹配到的词只能人工查找
|
4
xmai Jan 24, 2019
结巴分词
|
5
zzzzzzZ Jan 24, 2019
阿里云-数据智能-自然语言处理
不过我没用过,NLP 相关的定制化程度都太高了,很难有适合大部分人的接口 |
6
grac Jan 24, 2019
|
7
congeec Jan 24, 2019
如果你用 osx,我做了个系统自带补全的 python 接口
https://github.com/Congee/SpellChecker 如果你不关心单词各种变形,也不关心性能,也就一行命令的事儿 $ echo walk eat | tr ' ' '\n' | xargs -I{} -P4 grep \^{}\$ /usr/share/dict/words eat walk 还是并行的 |
8
congeec Jan 24, 2019
说白了就是查表
|
9
Sylv Jan 24, 2019 via iPhone
|
10
Trim21 Jan 24, 2019
找个词典查表吧
|
11
wxl1380610 Jan 24, 2019
solr ?
|
12
vipppppp Jan 24, 2019
我竟然看不懂 lz 表达什么意思。。
|
13
mscb Jan 24, 2019 via Android
结巴分词加词典查表
|
14
lastpass Jan 24, 2019
简单点就直接使用各种分词插件或者正则硬匹配。
进阶点就手撸词法分析器或者使用如 antl,拆分出 token 来就 OK。 →_→这是计算机基础啊。编译原理的最简单的词法分析。 |