V2EX  ›  英汉词典
Enqueued related words: Similarity Measure, Plagiarism Detection

Similarity Ratio

定义 / Definition

“Similarity ratio” 指“相似度比率/相似度指标”:用一个数值来表示两段文本、两个对象或两组数据彼此有多相似,常见于文本比对、抄袭检测、模糊匹配、信息检索与数据去重等场景。(不同领域的计算方法可能不同。)

发音 / Pronunciation (IPA)

/ˌsɪməˈlærɪti ˈreɪʃioʊ/

例句 / Examples

The software shows a similarity ratio of 85% between the two documents.
软件显示这两份文档的相似度比率为 85%。

After normalizing punctuation and removing stop words, the similarity ratio increased, suggesting the drafts share substantial overlapping content.
在统一标点并移除停用词后,相似度比率上升,说明这些草稿在内容上有大量重叠。

词源 / Etymology

“Similarity” 来自拉丁语 similis(“相像的”);“ratio” 来自拉丁语 ratio(“计算、比率、比例”)。组合起来就是“用比率/数值来衡量相似程度”的意思,现代多用于技术与统计语境。

相关词 / Related Words

文献与作品用例 / In Notable Works

  • Introduction to Information Retrieval(Manning, Raghavan, Schütze):讨论用多种“相似度度量”比较文档与查询。
  • Mining of Massive Datasets(Leskovec, Rajaraman, Ullman):涉及相似度、近似去重与文本/集合相似性指标。
  • Speech and Language Processing(Jurafsky & Martin):在信息检索与文本处理相关章节中使用相似度度量的概念。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3326 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 13:31 · PVG 21:31 · LAX 06:31 · JFK 09:31
♥ Do have faith in what you're doing.