层次聚类:一种无监督学习的聚类方法,通过逐步合并(自底向上,agglomerative)或逐步拆分(自顶向下,divisive)数据点/簇,形成一个“层级结构”,常用树状图(dendrogram)来展示不同层级下的聚类结果。(该术语在统计学、数据挖掘与机器学习中非常常见。)
/ˌhaɪəˈrɑːr.kɪ.kəl ˈklʌs.tər.ɪŋ/
Hierarchical clustering groups similar customers together.
层次聚类会把相似的客户归为一组。
Using hierarchical clustering with average linkage, we visualized the dataset as a dendrogram and chose a cut that produced four clusters.
使用平均链接法的层次聚类,我们用树状图可视化数据集,并选择一个切分高度得到四个簇。
hierarchical 来自希腊语 hierarkhia(“等级统治/层级体系”,由 hieros “神圣的” + arkhein “统治”构成),强调“有层级的结构”;clustering 源自英语 cluster(“群、簇、串”),指“聚成一团”。合在一起,“hierarchical clustering”字面意思就是“按层级结构进行聚类”。