上传者: 38746951
|
上传时间: 2022-06-30 15:50:12
|
文件大小: 96KB
|
文件类型: PDF
kNN(k-nearest neighbor)是一种基本的分类与回归的算法。这里我们先只讨论分类中的kNN算法。
k邻近算法的输入为实例的特征向量,对对应于特征空间中的点;输出为实例的类别,可以取多类,k近邻法是建设给定一个训练数据集,其中的实例类别已定,分类时,对于新的实例,根据其k个最邻近的训练实例的类别,通过多数表决等方式进行预测。所以可以说,k近邻法不具有显示的学习过程。k临近算法实际上是利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”
k值的选择,距离的度量和分类决策规则是k近邻算法的三个基本要素。
这里需要说明的是,对于距离的度量,我们有很多种度量方法可以选择,如