k-近邻算法概述: 所谓k-近邻算法KNN就是K-Nearest neighbors Algorithms的简称,它采用测量不同特征值之间的距离方法进行分类 用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。 k-近邻算法分析 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型 k-近邻算法工作原理: 它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个
2021-12-30 11:18:01 147KB k近邻算法 python python算法
1
为了使数据集的内在分布更好地影响训练模型, 提出一种密度加权孪生支持向量回归机算法. 该算法通过?? 近邻算法计算获得每个数据点基于数据密度分布的密度加权值, 并将密度加权值引入到标准孪生支持向量回归机算法中. 算法能够很好地反映训练数据集的内在分布, 使数据点准确影响训练模型. 通过6 个UCI 数据集上的实验结果分析验证了所提出算法的有效性.
2021-12-30 09:42:24 148KB 密度加权|?? 近邻法|内在分布
1
K 近邻算法脑图
2021-12-30 09:08:12 156KB 机器学习 K近邻算法
1
kdtree 提供了 kd-tree 的简约实现。 该实现既可以通过 MEX 调用在 MATLAB 内部使用,也可以作为独立工具直接从 C/C++ 程序使用。 网站上的图片带有“ fulltest.m”字样此实现提供以下功能: - kdtree_build: kd 树构造 O( n log^2(n) ) - kdtree_delete:释放由 kdtree 分配的内存- kdtree_nearest_neighbor:最近邻查询(针对一个或多个点) - kdtree_k_nearest_neighbors:单个查询点的 kNN - kdtree_range_query:矩形范围查询- kdtree_ball_query:查询与点的距离增量的样本重要说明:由于 Matlab 提供了一个 kdtree,我对维护此代码失去了兴趣。
2021-12-28 21:08:00 338KB matlab
1
python开发的手写数字识别。 详情参考:http://blog.csdn.net/faaronzheng/article/details/50908961
2021-12-28 20:36:41 51KB KNN k近邻 手写数字识别
1
变量选择是分类中最重要的模型选择问题之一。 提出了一种新的基于局部偏最小二乘(KPLS)子空间中的最近邻(FNN)的方法,以选择简约变量作为非线性建模输入。 首先,将非线性输入简化为KPLS子空间的主要成分。 此外,它们的重要性的顺序是根据FNN在KPLS子空间中启发的距离度量确定的。 这样,识别出了不重要的变量。 最后,使用不同的参数模型研究了3个典型分类问题的变量选择。 结果表明,该方法对非线性模型约简是有效的。 因此,可以用于非线性系统的变量选择。
2021-12-27 12:50:02 785KB Kernel Partial Least Squares;
1
全k近邻(all k-nearest neighbor,AkNN)查询,是k近邻查询的一个变型,旨在在一个查询过程中为给定数据集的每个对象确定k个最近邻。提出了一种在Hadoop分布式平台下处理高维大数据的AkNN查询算法。首先使用行条化思想结合p-stable LSH算法将高维数据对象降维,然后结合空间填充曲线Z-order的优良特性,把降维后的数据嵌入一维空间中,接着进行范围查询。整个过程使用MapReduce框架分布式并行处理。实验结果表明,所提出的算法可以高效处理高维大数据的AkNN查询。
1
4.K-最近邻(KNN)分类并行化算法 基本算法设计思想 K-最近邻是分类器算法中最通俗易懂的一种,计算测试样本到各训练样本的距离,取其中距离最小的K个,并根据这K个训练样本的标记进行投票得到测试样本的标记。 加权K-最近邻分类算法的思路是,在根据测试样本的标记进行投票表决时,将根据测试样本与每个训练样本间距离(或相似度)的大小决定训练样本标记的作用大小,基本原则是:距离越近的训练样本其标记的作用权重越大,反之则越小。据此,可以建立一个带加权的投票表决计算模型(比如y’ = ∑Si*yi/∑Si, k=[0,k-1],Si为取值0-1的相似度数值,yi为选取出的最邻近训练样本的分类标记值)决定以最终的测试样本的分类标记。 算法的思路清晰简单,然而对于海量数据计算量很大,耗费时间较长。
2021-12-25 13:22:33 24.75MB 大数据
1
详细讲解逻辑回归的数学推导过程,能够使用原生代码完成逻辑回归代码的编写。详细讲解K近邻算法的原理及原生代码的实现过程。能够调用sklearn库完成逻辑回归与KNN代码的编写。能够完成对鸢尾花数据集分类,能够完成手写数字识别案例。
2021-12-25 09:28:19 10.73MB 机器学习 逻辑回归 KNN K近邻 人工智能
1
针对传统钢轨检测方法不能满足线路检修的需要,提出了一种基于计算机视觉的钢轨扣件检测算法,运用投影法和特定区域像素点扫描统计相结合的方法定位扣件位置,使用灰度特征和HOG特征描述扣件特征向量,并利用Chi开方距离分类器进行特征提取。实验结果表明,该算法具有一定的有效性和可行性。
1