“Similarity ratio” 指“相似度比率/相似度指标”:用一个数值来表示两段文本、两个对象或两组数据彼此有多相似,常见于文本比对、抄袭检测、模糊匹配、信息检索与数据去重等场景。(不同领域的计算方法可能不同。)
/ˌsɪməˈlærɪti ˈreɪʃioʊ/
The software shows a similarity ratio of 85% between the two documents.
软件显示这两份文档的相似度比率为 85%。
After normalizing punctuation and removing stop words, the similarity ratio increased, suggesting the drafts share substantial overlapping content.
在统一标点并移除停用词后,相似度比率上升,说明这些草稿在内容上有大量重叠。
“Similarity” 来自拉丁语 similis(“相像的”);“ratio” 来自拉丁语 ratio(“计算、比率、比例”)。组合起来就是“用比率/数值来衡量相似程度”的意思,现代多用于技术与统计语境。