在许多实际的数据挖掘应用程序中,例如文本分类,可以轻松获得未加标签的训练示例,但获得加标签的训练示例则相当昂贵。 因此,半监督学习算法引起了数据挖掘和机器学习领域的极大兴趣。 近年来,基于图的半监督学习已成为半监督学习社区中最活跃的研究领域之一。 本文提出了一种基于线性邻域模型的新颖的基于图的半监督学习方法,该方法假设每个数据点都可以从其邻域进行线性重构。 我们的算法称为线性邻域传播(LNP),可以使用这些线性邻域以足够的平滑度将标签从标记点传播到整个数据集。 本文对LNP的性质进行了理论分析。 此外,我们还导出了一种简单的方法来将LNP扩展到样本外数据。 对于合成数据,数字和文本分类任务,提出了有希望的实验结果。
1