data profile:数据概况 / 数据画像。指对一份数据集(或某个用户/客户/设备的数据)进行汇总与描述的结果,通常包含数据的结构、字段含义、分布特征、缺失值、异常值、质量指标等,用于理解数据与支持分析、治理或建模。(在不同语境下也可指“用户数据档案/资料画像”。)
/ˈdeɪtə ˈproʊfaɪl/(也常见 /ˈdɑːtə ˈproʊfaɪl/)
The analyst created a data profile to check for missing values.
分析师制作了一个数据概况,用来检查缺失值。
Before training the model, we built a data profile that summarized distributions, outliers, and data quality issues across all features.
在训练模型之前,我们先建立了数据画像,汇总了所有特征的分布、离群点以及数据质量问题。
data 源自拉丁语 datum(“给出的事物”),在现代英语中常指“数据”。profile 原指“侧面轮廓”,后引申为“概况/简介/特征描述”。组合成 data profile,即“对数据的特征做出轮廓式的描述与总结”。
(该术语更常见于技术与数据类写作中,以下作品讨论的数据分析/质量与“数据概况(data profiling)”密切相关,并常出现类似表述。)