Training data(训练数据):用于“训练”机器学习/人工智能模型的一组样本数据,通常包含输入(特征)以及(在监督学习中)对应的正确答案/标签,用来让模型学习规律并提升预测能力。(在不同任务中也可能包含文本、图像、音频、表格等多种形式。)
/ˈtreɪnɪŋ ˈdeɪtə/(也常听到 /ˈtreɪnɪŋ ˈdætə/)
The model learned from training data.
模型从训练数据中学习。
To reduce bias, we cleaned the training data and added more examples from underrepresented groups.
为了减少偏差,我们清理了训练数据,并加入了更多来自代表性不足群体的样本。
training 来自 “train”(训练、培养),与“使之具备某种能力”相关;data 源自拉丁语 datum(“给出的东西”),其复数形式 data 后来在英语中常被当作集合名词使用。组合成 training data,字面意思就是“用于训练的数据”,在机器学习兴起后成为核心术语之一。