近似字符串匹配:在允许一定“差异”(如插入、删除、替换字符)的情况下,判断两个字符串是否足够相似,或在文本中找到与目标模式“差不多”的匹配。常用于拼写纠错、模糊搜索、DNA/蛋白序列比对、去重与相似文本检测等。(也常被称为 fuzzy matching 的一种。)
/əˈprɑːksɪmət ˈstrɪŋ ˈmætʃɪŋ/
I used approximate string matching to fix typos in user queries.
我用近似字符串匹配来修正用户查询里的拼写错误。
In large databases, approximate string matching helps find records even when names are misspelled or formatted differently.
在大型数据库中,即使姓名拼错或格式不同,近似字符串匹配也能帮助找到相关记录。
approximate 源自拉丁语 approximare(“接近”),强调“不是完全一致,而是足够接近”;string 在计算中指“字符序列”;matching 来自 match(“配对/匹配”)。合起来指:对“字符序列”进行“近似的匹配”,强调允许误差与相似度度量(如编辑距离)。