好的聚类:类内凝聚度高,类间分离度高。
本文介绍两种聚类评估方法,轮廓系数(Silhouette Coefficient)以及标准化互信息(NMI),并且用Python实现。
导航效果评估综述轮廓系数互信息参考文章
效果评估综述
这里直接贴上 聚类算法初探(七)聚类分析的效果评测
它摘自于中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的第三章。建议先看看原文,可以对聚类评估有一个很好的了解。
综合来说,我们希望最终的聚类结果是:同一个簇内的点是紧密的,而不同簇之间的距离是较远的;同时,它也要与我们人工的判断相一致。
接下来介绍两种聚类评估方
2021-08-19 15:03:00
204KB
互信息
聚类
1