distribution shift(分布漂移/分布偏移):指训练数据与实际部署或测试时的数据分布不一致,导致模型在现实场景中表现下降的现象。在机器学习与统计中很常见(也常与 dataset shift、domain shift 等近义概念并用)。
/ˌdɪstrɪˈbjuːʃən ʃɪft/
The model worked well in the lab, but it failed after a distribution shift.
这个模型在实验室里效果很好,但在发生分布漂移后就失效了。
Because consumer habits changed over time, the recommendation system suffered from distribution shift and needed retraining.
由于消费者习惯随时间变化,这个推荐系统出现了分布偏移,需要重新训练。
distribution 源自拉丁语 distributio(“分配、分发”),在统计语境中指“数据的概率分布”;shift 表示“移动、变化”。合起来用于技术语境,字面即“分布发生变化”,强调数据生成机制或特征/标签关系随环境改变而偏离训练时期。