low-data(低数据/小数据):形容可用训练数据或标注数据很少的情境(常见于机器学习、自然语言处理、计算机视觉等领域),强调在数据稀缺条件下进行建模、学习或评估。也常写作 low data(不加连字符)。
/ˌloʊ ˈdeɪtə/
We’re testing the model in a low-data setting.
我们正在低数据环境下测试这个模型。
Low-data regimes often require careful regularization and strong prior knowledge to avoid overfitting.
在低数据条件下,往往需要更谨慎的正则化与更强的先验知识,以避免过拟合。
由 low(低的、少的)+ data(数据) 组合而成的现代复合形容词,起源于科学与工程语境,用来概括“数据量不足”的研究与应用问题;连字符写法常用于强调其作为一个整体概念修饰名词(如 low-data learning)。
该词更常见于学术论文与技术出版物(而非传统文学作品)中,尤其在机器学习与自然语言处理研究里,例如常见于会议论文标题与摘要中(如 NeurIPS、ICLR、ACL、EMNLP 等会议论文中关于 low-data learning / low-data regimes 的表述)。