(2)对地图上的点进行聚类
现在有一个存有 70个地址和城市名的文本,而没有这些地点的距离信息。而我们想要对
这些地点进行聚类,找到每个簇的质心地点,从而可以安排合理的行程,即不同簇中的地点
之间选择交通工具抵达,而位于同一个簇内的地点之间可以采取步行的方法抵达。使用二分
K-means算法可以为我们找到一种更加经济而且高效的出行方式。
要求:
1、地点对应的经纬度保存在 places.txt文件中,可以通过提取文本数据获得。
2、使用球面余弦定理来计算两个经纬度之间的实际距离。
3、选择合适的 k值,使用二分 K-means 算法对地图上的点进行聚类分析。
4、尝试 3种 k的取值,分别计算出对应的 SSE值并进行简单分析。
5、将数据分为 k 个簇,并通过 matplotlib 可视化显示,其中不同簇内的样本点用不同
颜色表示,簇的质心用深色十字表示。(需对应条件 4中的 k值,画出对应的可视图)
1