代码说明
代码仅供学习研究,未经允许,请勿擅自商用。
1.输入文件格式
输入的文件要求为N行两列的形式,两列分别对应,输入数据点的X轴坐标和Y轴坐标。
输入文件格式示例如下:
0.821794 -0.0462153
1.03929 0.060835
1.12046 0.0745568
1.02233 0.0514739
2.代码支持的凝聚层次聚类算法
通过简要的修改代码中函数的参数,代码可以支持不同的凝聚方法,支持的凝聚方法如下,默认的为代码本身算法:
单连接算法(默认,最近邻聚类算法,最短距离法,最小生成树算法);全连接算法(最远邻聚类算法,最长距离法);未加权平均距离法;加权平均法;质心距离法;加权质心距离法;内平方距离法(最小方差算法)
3.代码支持的距离(相似度)度量公式
通过简要的修改代码,代码支持计算距离的过程采用不同的距离或相似度度量公式,支持的距离(相似度)公式如下,默认为代码本身才采用的距离公式:
欧氏距离(默认);标准化欧氏距离;马氏距离;布洛克距离(曼哈顿距离,城市街区距离);闵可夫斯基(明可夫斯基)距离;余弦相似度;相关性相似度;汉明距离;Jaccard相似度;切比雪夫距离。
1