1
3dwelcome 2021-12-15 01:41:54 +08:00
建索引啊,还能有什么办法。
要查找速度上去,那就要看着这索引,建的好不好了。 至于具体算法,那就是 bloom filter 魔改。 |
2
dbsquirrel 2021-12-15 03:03:54 +08:00 via iPhone
让我想起了这个
https://v2ex.com/t/814478 |
3
murmur 2021-12-15 07:48:20 +08:00
具体场景是什么
什么叫普通的文本数据 如果是内部的数据库慢就慢呗 不能违背物理定律 如果是商业的 可以对热门词汇缓存 |
4
qping 2021-12-15 09:21:52 +08:00
百万条都加载到内存里,怎么匹配都快
|
5
dddd1919 2021-12-15 09:44:49 +08:00
ES 分词不好处理?中文上 IK 啊
|
6
changnet 2021-12-15 09:48:27 +08:00
精准匹配?用个字典树或者 acism ,百万的词库匹配起来都是毫秒级的,这在关键字过滤经常用
|
7
IsaacYoung 2021-12-15 09:57:12 +08:00
tire
|
9
lhx2008 OP 不能分词的数据,现在就是直接字符完全匹配,类似 mysql 的 like %xxx%
|
10
lhx2008 OP 小项目才能这么完,从数据库同步数据开销也很大的
|
11
abersheeran 2021-12-15 14:09:57 +08:00
radix tree 完事,只要内存能完全放得下,那搜索速度就和你数据量没什么关系。
|