在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显得尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。
2022-05-30 13:58:45 1.05MB 多标签分类 ML-KNN 聚类
1
网络上聚类分析最近邻距离代码较少,本程序基于最近邻距离算法动态查找聚类中心,可以输入任意维度与数量的样本并自动进行聚类操作,其中二维样本可以进行可视化,实现了对任意维度任意样本的聚类操作。
2021-08-26 17:43:19 2KB 聚类分析 最近邻距离 程序代码
1