KNN(K-Nearest-Neighbours Classiflication)分类算法,供大家参考,具体内容如下
最简单的分类算法,易于理解和实现
实现步骤:通过选取与该点距离最近的k个样本,在这k个样本中哪一个类别的数量多,就把k归为哪一类。
注意
该算法需要保存训练集的观察值,以此判定待分类数据属于哪一类
k需要进行自定义,一般选取k<30
距离一般用欧氏距离,即
通过sklearn对数据使用KNN算法进行分类
代码如下:
## 导入鸢尾花数据集
iris = datasets.load_iris()
data = iris.data[:, :2]
target
1