k-means聚类算法及matlab代码 机器学习与数据挖掘实验 . 目录 实验内容 小组成员 队长:张奥翔 队员:何锦辉、王浩辉、吴振廷 仓库文件内容说明 文件/目录 说明 实验一 多源数据集成、清洗和统计 实验二 数据统计和可视化数据统计和可视化 实验三 k-means聚类算法 实验四 逻辑回归二分类 实验一 多源数据集成、清洗和统计 题目 : ​ 广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失 、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。 0、两个数据源合并后读入内存,并统计: 1、学生中家乡在Beijing的所有课程的平均成绩: 2、学生家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量: 3、比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? 4、学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩分别与体能成绩计算相关性) (1) (2) 实验二 数据统计和可视化 题目 : 基于实验一中清洗后的数据练
2022-05-22 16:35:18 523KB 系统开源
1
你好,这个 repo 讨论分类和聚类, 算法包含KMeans、KNN和Hierarchical clustering。 我希望你能通过这个 repo 得到帮助,如果时间允许,我会推出更多的算法。 参考 K均值: : KNN: :
2022-05-22 09:17:10 4KB Python
1
道路交通拥堵正在成为发展中国家的一个严重问题,并严重影响着各国的经济。 城市道路日益拥堵对城市地区的经济增长和宜居性构成了真正的威胁。 大多数交通拥堵是由于计划外的道路网络、大量车辆和严重拥堵区域的存在造成的。 交通拥堵不仅对经济构成威胁,也对环境构成威胁。 从拥挤的主要道路到次要道路和小街的溢出效应作为替代路线通常会导致更多的拥堵; 由于间距过小和不断的走走停停,增加了碰撞和事故的机会。 下面的论文通过估计城市道路网络上实时交通拥堵的范围并预测到目的地的替代最短路线,提出了一种智能拥堵避免技术。 所提出的系统使用 K-Means 聚类算法来估计不同道路上的拥堵程度,然后使用 Dijkstra 算法来预测最短路线。 一旦用户将目的地输入系统,系统就会预测出距离用户当前位置的最短路线。 在每个路口重复该过程,直到用户到达目的地。 论文链接: http : //ieeexplore.ieee.
2022-05-21 21:44:11 12.5MB matlab
1
% 使用高斯分布(正态分布) % 随机生成3个中心以及标准差 s = rng(5,'v5normal'); mu = round((rand(3,2)-0.5)*19)+1; sigma = round(rand(3,2)*40)/10+1; X = [mvnrnd(mu(1,:),sigma(1,:),200); ... mvnrnd(mu(2,:),sigma(2,:),300); ... mvnrnd(mu(3,:),sigma(3,:),400)];
2022-05-21 11:48:30 337KB matlab 聚类分析 自己编写
1
学习资源 第4章 回归与聚类算法 2 4.1. 线性回归 2 4.1.1. 线性回归的原理 2 4.1.2. 线性回归的损失和优化原理(理解记忆) 5 4.1.3. 线性回归API 9 4.1.4. 波士顿房价预测 10 4.1.5. 拓展-关于优化方法GD、SGD、SAG 14 4.1.6. 总结 15 4.2. 欠拟合与过拟合 15 4.2.1. 什么是过拟合与欠拟合 15 4.2.2. 原因以及解决办法 17 4.3. 线性回归的改进-岭回归 19 4.3.1. 带有L2正则化的线性回归-岭回归 19 4.4. 分类算法-逻辑回归与二分类 21 4.4.1. 逻辑回归的应用场景 21 4.4.2. 逻辑回归的原理 21 4.4.3. 逻辑回归API 23 4.4.4. 案例:癌症分类预测-良/恶性乳腺癌肿瘤预测 23 4.4.5. 分类的评估方法 25 4.5. 模型保存与加载 29 4.5.1. sklearn模型的保存和加载API 29 4.5.2. 线性回归的模型保存加载案例 29 4.6. 无监督学习-K-means算法 30 4.6.1. 什么是无监督学习 30 4.6
2022-05-21 11:06:17 11.08MB 机器学习 深度学习
1
K-means聚类算法研究及应用
2022-05-20 23:00:31 1.43MB K-means聚类算法研究及应用.
1
DBSCAN_matlab Matlab中DBSCAN聚类分析算法的实现
2022-05-20 22:12:21 2KB MATLAB
1
SOM神经网络 SOM神经网络是一种基于模型的聚类方法。SOM神经网络由输入层和竞争层组成。 输入层由N个输入神经元组成,竞争层由mm = M个输出神经元组成,且形成一个二维平面阵列。 输入层各神经元与竞争层各神经元之间实现全互连接。 该网络根据其学习规则,通过对输入模式的反复学习,捕捉住各个输入模式中所含的模式特征,并对其进行自组织,在竞争层将聚类结果表现出来,进行自动聚类。竞争层的任何一个神经元都可以代表聚类结果。
2022-05-20 07:57:37 598KB 聚类 数据挖掘 伪代码 例子
1
利用 Matlab 和 SPSS 软件实现聚类分析(9页).pdf
2022-05-19 09:10:00 255KB matlab 源码软件 开发语言
凝聚层次聚类算法 matlab源码.docx
2022-05-19 09:09:00 18KB 算法 源码软件 聚类 matlab