最近搞文本相似,simhash得到的64位fingerprint,测试发现hamming distance在10左右的时候相似。
问题来了,下一步给定hash值,搜索hamming distance在10左右的fingerprint,没想明白怎么回事。csdn上有一篇文章: http://blog.csdn.net/meijia_tts/article/details/8001016,比较愚钝,后续处理没怎么看懂
有没有做过相关工作的兄弟,指导指导啊
问题来了,下一步给定hash值,搜索hamming distance在10左右的fingerprint,没想明白怎么回事。csdn上有一篇文章: http://blog.csdn.net/meijia_tts/article/details/8001016,比较愚钝,后续处理没怎么看懂
有没有做过相关工作的兄弟,指导指导啊