简便的KNN分类算法,可以处理有监督数据的分类问题,运用的是邻域粗糙集的基本概念,有兴趣的可以在本程序上再加以改进,比如加权,多粒度等等的方法。
2021-12-25 23:56:16 753B 邻域粗糙集
1
4.K-最近邻(KNN)分类并行化算法 基本算法设计思想 K-最近邻是分类器算法中最通俗易懂的一种,计算测试样本到各训练样本的距离,取其中距离最小的K个,并根据这K个训练样本的标记进行投票得到测试样本的标记。 加权K-最近邻分类算法的思路是,在根据测试样本的标记进行投票表决时,将根据测试样本与每个训练样本间距离(或相似度)的大小决定训练样本标记的作用大小,基本原则是:距离越近的训练样本其标记的作用权重越大,反之则越小。据此,可以建立一个带加权的投票表决计算模型(比如y’ = ∑Si*yi/∑Si, k=[0,k-1],Si为取值0-1的相似度数值,yi为选取出的最邻近训练样本的分类标记值)决定以最终的测试样本的分类标记。 算法的思路清晰简单,然而对于海量数据计算量很大,耗费时间较长。
2021-12-25 13:22:33 24.75MB 大数据
1
随着大数据时代的到来,K最近邻(KNN)算法较高的计算复杂度的弊端日益凸显。在深入研究了KNN算法的基础上,结合MapReduce编程模型,利用其开源实现Hadoop,提出了一种基于MapReduce和分布式缓存机制的KNN并行化方案。该方案只需要通过Mapper阶段就能完成分类任务,减少了TaskTracker与JobTracker之间的通信开销,同时也避免了Mapper的中间结果在集群任务节点之间的通信开销。通过在Hadoop集群上实验,验证了所提出的并行化KNN方案有着优良的加速比和扩展性。
2021-12-24 14:09:54 370KB KNN分类算法
1
k-近邻算法是基本的机器学习算法,算法的原理非常简单: 输入样本数据后,计算输入样本和参考样本之间的距离,找出离输入样本距离最近的k个样本,找出这k个样本中出现频率最高的类标签作为输入样本的类标签,很直观也很简单,就是和参考样本集中的样本做对比。下面讲一讲用python实现kNN算法的方法,这里主要用了python中常用的numpy模块,采用的数据集是来自UCI的一个数据集,总共包含1055个样本,每个样本有41个real的属性和一个类标签,包含两类(RB和NRB)。我选取800条样本作为参考样本,剩下的作为测试样本。 下面是分类器的python代码: ''' kNNClassify(inp
2021-12-21 17:31:47 161KB knn python python函数
1
KNN分类算法,当K=1时,计算最相似的一个点。 输入需为csv文件
2021-12-20 18:24:56 1KB matlab 降维
1
使用Knn算法对KDDcup99进行分类处理,包含部分数据集,并对数据集进行了预处理,包括特征选择,标准化,归一化等;
2021-12-14 19:31:19 572KB 标准化处理 knn分类 knn kddcup99
瑜伽姿势估计应用程序 表中的内容 概述:- 这是一个瑜伽姿势估计应用程序,它可以通过使用posenet和KNN分类器实时检测瑜伽姿势。 这里使用的数据集是自定义数据集,由 3 个视频组成,用于表示 3 种不同的姿势。 它部署在heroku中。 需要注意的一件事,即这将适用于所有移动和边缘设备。 动机:- 这个项目是我在 ShapeAI 实习的一部分,担任机器学习工程师实习生。 该项目可以扩展为完美的瑜伽教练,以使用 AI 跟踪姿势并保持健康。 技术方面:- 该项目主要分为前端,后端两部分。 让我们详细讨论它们中的每一个。 前端部分:-主要是从前摄像头采集姿态图像,用于姿态识别。 该图像被传递给在 ml5.js 中预训练的posenet模型并获取计数部分位置x和y并将它们保存以以json的形式获取数据。 我们将从图像中检测到 17 个姿势,其中有 2 个与之相关的值,总共 34 个
2021-12-09 19:09:14 75.32MB flask machine-learning deep-learning p5js
1
为了提高k-nearest neighbor algorith m(KNN)算法处理大数据集的能力,本文利用Ma pReduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现。通过设计Ma p、Co mbine和Reduce 3个函数,实现了KNN算法的并行化。Ma p函数完成每个测试样本与训练样本之间的相似度计算,Co mbine函数作为一个本地的Reduce操作,用以减少中间计算量及通信开销,Reduce函数则根据上述函数得到的中间结果计算出k近邻并作出分
2021-12-03 20:16:41 476KB 工程技术 论文
1
KNN算法的c++两种不同实现,内涵两个版本的代码工程,数据集为iris,vs2013可用
2021-12-03 14:08:33 1.82MB KNN分类
1
1. KNN KNN被翻译为最近邻算法,顾名思义,找到最近的k个邻居,在前k个最近样本(k近邻)中选择最近的占比最高的类别作为预测类别。 如上图所示: 五角星(待预测的)要被赋予哪个类,是紫色圆形还是黄色圆形? 1)如果k=3(实线所表示的圆),由于紫色圆形所占比例为2/3,大于黄色圆形所占的比例1/3,那么五角星将被赋予紫色圆形那个类。 2)如果k=5(虚线所表示的圆),由于黄色圆形的比例为3/5大于紫色圆形所占的比例2/5,那么五角星被赋予黄色圆形类。 通过上述这个例子,我们可以简单总结出KNN算法的计算逻辑。 1)给定测试对象,计算它与训练集中每个对象的距离。 2)圈定距离最近的k个训
2021-11-12 00:39:41 203KB knn 分类
1