文章首发于 个人博客 引言 k 近邻法(k-nearest-neighbor, KNN)是一种基本的分类和回归方法。现在只讨论其分类方面的应用,它不具备明显的学习过程,实际上是利用已知的训练数据集对输入特征向量空间进行划分,并作为其分类的“模型”。 其中 k 值的选择、距离的度量及分类决策规则是 k 近邻模型的三个基本要素。 本文将按照以下提纲进行: k 近邻法阐述 k 近邻的模型 k 近邻在手写数字识别上的实战 k 近邻法阐述 k 近邻算法非常容易理解,因为其本质上就是求距离,这是非常简单而直观的度量方法:对于给定的一个训练数据集,对新的输入实例 M,在训练数据集中找到与该新实例 M 最邻近
2022-06-20 17:29:21 344KB
1
使用多种方法完成MNIST分类任务 Python 3.6 Pytorch 1.0 Scikit-learn 0.21 无需下载数据直接跑,代码自动下载 逻辑回归 Logistic Regression 多层感知机 MLP K近邻 KNN 支持向量机 SVM 卷积神经网络 CNN 循环神经网络 RNN
2022-06-19 17:05:18 1.04MB SVM CNN RNN KNN
K近邻算法(或简称kNN)是易于理解和实现的算法,而且是你解决问题的强大工具。 什么是kNN kNN算法的模型就是整个训练数据集。当需要对一个未知数据实例进行预测时,kNN算法会在训练数据集中搜寻k个最相似实例。对k个最相似实例的属性进行归纳,将其作为对未知实例的预测。 相似性度量依赖于数据类型。对于实数,可以使用欧式距离来计算。其他类型的数据,如分类数据或二进制数据,可以用汉明距离。 对于回归问题,会返回k个最相似实例属性的平均值。对于分类问题,会返回k个最相似实例属性出现最多的属性。 kNN如何工作 kNN属于基于实例算法簇的竞争学习和懒惰学习算法。 基于实例的算法运用数据实例(或数
2022-06-18 13:14:34 61KB k近邻算法 python python函数
1
基于自适应模糊k近邻法的破产预测模型
2022-06-15 18:50:54 1.88MB 研究论文
1
主要介绍了Python利用Faiss库实现ANN近邻搜索的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
2022-06-14 16:25:29 66KB python 常用库 python faiss库
1
matlab_手写体数字识别的程序,用了三种方法,贝叶斯,最近邻和BP神经网络
2022-06-14 15:12:14 158KB matlab 手写体识别 贝叶斯
一种基于聚类的个人信用评估分类模型,陈新泉,,本文先介绍了个人信用评估的概念及评估模型大致的发展历程,从而很自然地得出采用数据挖掘的方法与技术来建立信用评估模型是一个
2022-06-11 21:25:35 231KB 信用评估模型 聚类分类 近邻扩展
1
表现 测试数据:examples/data/3wu2.xyz,从PDB文件中提取的51053个粒子的坐标 3wu2 1
2022-06-11 18:06:33 1.43MB rust 算法
单元列表是一种解决固定半径近邻问题的算法。也就是说,它找到彼此相距固定距离内的所有点对。我们可以将细胞列表算法用作分子动力学或基于代理的模拟的一部分,其中相互作用势具有有限范围。 您可以在文章Searching for Fixed-Radius Near Neighbors with Cell Lists Algorithm in Julia Language中阅读更多相关信息,该文章更深入地探讨了 Cell Lists 算法及其背后的理论。我们还将算法扩展到多线程版本,我们在 Julia 语言中的 Julia 语言中的多线程应用于单元列表算法一文中对此进行了解释。 引文 您可以CellLists.jl通过导航到 Zenodo 提供的DOI来引用存储库和代码,然后从“导出”部分选择您喜欢的引用格式。例如,我们可以导出BibTex格式。或者,您可以使用右侧边栏中“关于”部分下方的“引用此存储库”按钮。
2022-06-10 09:06:31 23KB 算法 julia
ScANNS是Apache Spark的最近邻搜索库,最初由LinkedIn 机器学习算法团队的Namit Katariya开发。它可以在cosine、 jaccard和euclidean 距离空间内的批量离线上下文中进行最近邻搜索
2022-06-05 19:06:21 529KB scala apache spark 源码软件