鲁棒统计(稳健统计):统计学的一个分支,研究在数据含有离群点、重尾分布、模型偏离等“不理想情况”下,仍能保持可靠性的估计、检验与建模方法。常见目标是降低异常值对结论的影响(例如使用中位数、截尾/温莎化、M-估计等)。该术语也常写作 robust statistics(不一定加连字符)。
/rəˈbʌst stəˈtɪstɪks/
Robust statistics helps reduce the impact of outliers.
鲁棒统计有助于降低离群点的影响。
In large-scale experiments, robust statistical methods can provide more reliable estimates when the data are noisy or the model assumptions are slightly wrong.
在大规模实验中,当数据噪声较大或模型假设略有偏离时,鲁棒统计方法能给出更可靠的估计。
robust 源自拉丁语 robustus,意为“强健的、结实的”;在统计语境中引申为“对干扰不敏感、抗异常”。statistics 来自“state(国家/政务)”相关的词源传统,后来泛指“对数据的收集与分析”。合在一起,“robust statistics”强调:即使数据或假设不完美,结论也要“站得住”。