co-training(协同训练/共同训练):一种机器学习的半监督学习方法,通常在同一任务上使用两种(或多种)互补的“视图/特征集”分别训练模型,并用各自高置信度的预测结果为对方生成伪标签,从而利用未标注数据提升性能。(在更宽泛的语境中也可指“共同训练/联合培养”,但此处以机器学习常见义为主。)
/ˌkoʊˈtreɪnɪŋ/
Co-training can improve accuracy when labeled data is scarce.
当标注数据稀缺时,协同训练可以提高准确率。
In our experiment, we applied co-training with two feature views—text and metadata—to leverage thousands of unlabeled samples.
在我们的实验中,我们用两种特征视图(文本与元数据)进行协同训练,以利用数千条未标注样本。
由前缀 **co-**(表示“共同、协同”)+ training(训练)构成。该术语在机器学习领域中用于指代“两个模型(或两种视图)相互促进的训练流程”,强调“协作”与“互相提供学习信号”的思想。