上传者: 38743084
|
上传时间: 2021-03-13 12:07:07
|
文件大小: 2.16MB
|
文件类型: PDF
通常将序数回归(OR)定义为输入样本按序数等级进行排序的任务。 OR已经发现了各种各样的应用程序,并且已经完成了很多工作。 但是,大多数现有工作都集中在有监督/半监督的OR分类上,并且尚未明确解决半监督或OR聚类的问题。 在现实世界的OR应用程序中,标记大量的训练样本通常是耗时且昂贵的,而可以使用一组未标记的样本来建立OR模型。 此外,尽管样本标签不可用,但有时我们可以获得未标记样本的相对排名信息。 此样本排名信息可用于完善OR模型。 因此,如何在未加标签的样本上建立OR模型并将样本排名信息纳入提高聚类精度的过程仍然是OR应用程序的主要挑战。 在本文中,我们考虑了具有样本排序约束的半监督OR聚类问题,该问题给出了未标记样本的相对排名信息,并提出了一种用于半监督OR聚类的最大余量方法。 一方面,M²SORC寻求一组平行的超平面,以将未标记的样本划分为多个簇。 另一方面,提出了损失函数以将样本排名信息纳入聚类过程。 结果,制定了M²SORC的优化函数,以最大程度地增加最接近的相邻簇的余量,同时最大程度地减少与样本排序约束相关的损失。 在OR数据集上进行的大量实验表明,所提出的M²SORC方