具有K均值聚类和DBSCAN的CitiBike数据网络分析
该存储库使用网络科学方法和聚类技术检查CitiBike数据。 该数据可在上获得,而行程历史数据可在 。 csv.zip 2019年11月5日,05:10:56 pm用于此实验)。 使用K-means聚类和DBSCAN对自行车站网络进行进一步分析。
该文件包含以下属性-行程持续时间(秒),开始时间和日期,停止时间和日期,开始站点,名称,结束站点名称,站点ID,站点纬度/经度,自行车ID,用户类型(客户= 24小时通行证或3天通行证用户;订户=年度会员),性别(零=未知; 1 =男性; 2 =女性),出生年份。
为了可视化网络,进行以下数据处理。
•CSV文件存储在pandas数据框中,并随机采样50个条目。
•从采样数据中起始和结束站点ID的组合列表中,将所有唯一的起始和结束站点ID及其相应的站点名称,纬度和经度提取到新的数
1