t-closeness(t-接近性):一种数据匿名化的隐私模型,用来衡量“等价类”(被泛化/分组后的记录集合)中敏感属性的分布与整体数据集中该敏感属性的分布是否足够接近;若两者的距离不超过阈值 t,则认为满足 t-closeness,从而降低从分组数据中推断个体敏感信息的风险。(常与 k-anonymity、l-diversity 并列讨论;也存在更广义/变体定义。)
/tiː ˈkloʊsnəs/
A dataset can satisfy t-closeness by ensuring each group’s disease distribution matches the overall distribution.
一个数据集可以通过确保每个分组的疾病分布与总体分布一致来满足 t-closeness。
Even if a table meets k-anonymity, it may still leak information unless it also satisfies t-closeness under a suitable distance metric.
即使一张表满足 k-anonymity,如果在合适的距离度量下不满足 t-closeness,也可能仍会泄露信息。
该术语由字母 t(表示允许的阈值/上界)与 closeness(“接近程度”)组合而成,强调“分组内分布应与总体分布在阈值 t 以内足够接近”。它源自数据发布与统计数据库隐私保护领域,用于弥补仅靠 k-anonymity 或 l-diversity 仍可能发生的属性推断风险。