“Similarity score” 指“相似度分数/相似性评分”,用于量化两个对象(如文本、图像、向量、用户偏好、DNA 序列等)有多相似。分数通常越高表示越相似;具体范围取决于算法(例如 0–1、-1–1、0–100 等)。在信息检索、机器学习、推荐系统与自然语言处理中很常见。(也可泛指“相似度指标”的结果。)
/ˌsɪməˈlærɪti skɔːr/
The similarity score between the two sentences is high.
这两句话之间的相似度分数很高。
To reduce false matches, the system combines cosine similarity and edit distance, then uses the final similarity score to rank search results.
为减少误匹配,系统将余弦相似度和编辑距离结合起来,并用最终的相似度分数对搜索结果进行排序。
“Similarity” 源自拉丁语 similis(意为“相像的、类似的”),后来经法语进入英语;“score” 原意与“刻痕/记分”有关,逐渐发展为“分数、得分”。合在一起,“similarity score” 就是“用分数来表示相似程度”。