模式识别中的K均值算法改进

层次聚类 K均值不定K

K均值的时间复杂度为NKTD，其中，N代表样本个数，K代表k值，即聚类中心点个数，T代表循环次数，D代表样本数据的维度。本算法的改进主要在以下方面：一，初始聚类中心点，传统的初始中心点是随机选择，由于K均值算法受初始中心点影响较大，为获得更好的效果，在本方法中，先将数据采用层次聚类的方法预处理，得到的k个中心点作为K均值算法的中心点。二，传统的聚类中心点更新是在结束一次循环后，本方法的聚类中心采用实时更新策略，即每次将一个模式归于一个新的聚类中心时，即立刻更新新的所属中心和原属聚类中心的中心值，增强算法的收敛性。三，为达到类内方差最小化，类类方差最大化这一原则，考虑到往往设定的K值不一定能很好实现聚类效果，故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数，另设一聚类中心个数上限maxK。其具体实现如下： 1）当一待聚类的模式得到其最近中心时，计算该聚类中心类内方差和将此模式归于该中心之后的类内方差，如果两者差别大于某设定阈值，则以该模式数据为基础，得到一新的聚类中心。 2）当当前聚类中心个数等于设定的最大聚类中心时，合并最相邻的两个聚类。为使得到的聚类效果更为均衡，应该优先合并维度较小的聚类类别。

文件下载

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

模式识别中的K均值算法改进

文件下载

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载