上传者: 38516956
|
上传时间: 2022-12-05 15:24:10
|
文件大小: 76KB
|
文件类型: PDF
本文实例讲述了Python机器学习k-近邻算法。分享给大家供大家参考,具体如下:
工作原理
存在一份训练样本集,并且每个样本都有属于自己的标签,即我们知道每个样本集中所属于的类别。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后提取样本集中与之最相近的k个样本。观察并统计这k个样本的标签,选择数量最大的标签作为这个新数据的标签。
用以下这幅图可以很好的解释kNN算法:
不同形状的点,为不同标签的点。其中绿色点为未知标签的数据点。现在要对绿色点进行预测。由图不难得出:
如果k=3,那么离绿色点最近的有2个红色三角形和1个蓝色的正方形,这3个点投票,于是绿色的