传统的聚类专注于创建一个单一的好的聚类解决方案,而现代的、高维的数据通常可以以不同的方式进行解释,从而进行聚类。 替代聚类旨在创建多个高质量且彼此不同的聚类解决方案。 替代聚类方法可以分为面向目标函数和面向数据转换的方法。 我们提出了一种新的基于信息理论、面向目标函数的方法,以无监督或半监督的方式生成替代聚类。 我们采用条件熵度量来量化聚类质量和独特性,从而产生分析一致的组合标准。 与其他一些基于信息论的方法不同,我们采用一个计算效率高的非参数熵估计器, 这不对概率分布施加任何假设。 我们提出了一种名为 minCEntropy 的分区聚类算法,以同时优化聚类质量和独特性。 minCEntropy 只需要设置几个相当直观的参数,并且与现有的替代聚类方法相比具有竞争力。
2022-02-20 09:27:53
6KB
matlab
1