Winsorization(温莎化/缩尾处理):一种稳健统计处理方法,把数据中极端值(尾部)替换为某个分位点上的值(例如把最低的 1% 替换为第 1 百分位数、最高的 1% 替换为第 99 百分位数),以减少离群值对均值、方差等统计量的影响。常用于金融、医学与数据分析中的“抗异常值”预处理。
/ˌwɪnzəraɪˈzeɪʃən/
Winsorization can reduce the impact of extreme outliers.
温莎化可以降低极端离群值带来的影响。
After winsorization at the 1st and 99th percentiles, the estimated mean stabilized, but the analysis still preserved most of the original data.
在第 1 与第 99 百分位进行温莎化后,估计均值更稳定了,同时分析仍保留了大部分原始数据的信息。
Winsorization 源自人名 Charles P. Winsor(查尔斯·P·温莎),该方法以他命名;后缀 -ization 表示“使……化/处理成……的过程”。它与 trimming(截尾)相关,但区别在于:截尾是“删掉”极端值,而温莎化是“用分位点值替换”极端值。
由于该词属于统计学术语,更常见于教材与研究著作中,例如: