k-means聚类算法及matlab代码
机器学习与数据挖掘实验
.
目录
实验内容
小组成员
队长:张奥翔
队员:何锦辉、王浩辉、吴振廷
仓库文件内容说明
文件/目录
说明
实验一
多源数据集成、清洗和统计
实验二
数据统计和可视化数据统计和可视化
实验三
k-means聚类算法
实验四
逻辑回归二分类
实验一
多源数据集成、清洗和统计
题目
:
广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失
、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。
0、两个数据源合并后读入内存,并统计:
1、学生中家乡在Beijing的所有课程的平均成绩:
2、学生家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量:
3、比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些?
4、学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩分别与体能成绩计算相关性)
(1)
(2)
实验二
数据统计和可视化
题目
:
基于实验一中清洗后的数据练
2022-05-22 16:35:18
523KB
系统开源
1