V2EX  ›  英汉词典

Term Frequency

Definition / 释义

term frequency(词项频率,简称 TF):在一段文本、一个文档或语料中,某个词/词组(term)出现的次数或其标准化后的频率。常用于信息检索与自然语言处理(如 TF-IDF)来衡量词在文档中的重要性。(也可能指“某术语在某领域文本中的出现频率”。)

Pronunciation / 发音

/tɝːm ˈfriːkwənsi/

Examples / 例句

The term frequency of “data” in this article is 12.
“data” 在这篇文章里的词项频率是 12。

To reduce bias from long documents, we normalize term frequency before computing TF-IDF scores for ranking.
为减少长文档带来的偏差,我们在计算用于排序的 TF-IDF 分数前先对词项频率进行归一化处理。

Etymology / 词源

term 来自拉丁语 terminus(界限、术语之意),引申为“词项/术语”;frequency 来自拉丁语 frequentia(频繁、次数)。二者组合成 term frequency,在信息检索与文本统计中专指“某词项在文本中出现的次数/频率”,并在现代算法(如 TF-IDF)中成为基础概念。

Related Words / 相关词

Literary Works / 文学作品

  • Introduction to Information Retrieval(Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze):系统讲解 term frequency 与 TF-IDF、向量空间模型等。
  • Foundations of Statistical Natural Language Processing(Christopher Manning, Hinrich Schütze):在词频统计与文本建模章节中使用并讨论 term frequency
  • Speech and Language Processing(Daniel Jurafsky, James H. Martin):在特征工程、文本分类等内容中常出现 term frequency(如用作词袋特征)。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1712 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 06:35 · PVG 14:35 · LAX 22:35 · JFK 01:35
♥ Do have faith in what you're doing.