首页 / 知识

Python K-近邻算法概述

2023-11-12 13:31:00

简单来说K-近邻算法采用测量不同特征值之间的距离方法进行分类。

K最近邻(k-NearestNeighbor，KNN)，是一种常用于分类的算法，是有成熟理论支撑的、较为简单的经典机器学习算法之一。该方法的基本思路是：如果一个待分类样本在特征空间中的k个最相似(即特征空间中K近邻)的样本中的大多数属于某一个类别，则该样本也属于这个类别，即近朱者赤，近墨者黑。显然，对当前待分类样本的分类，需要大量已知分类的样本的支持，其中k通常是不大于20的整数。KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最近邻的一个或者几个样本的类别来决定待分样本所属的类别。因此KNN是一种有监督学习算法。

简单的例子解释KNN算法

最简单最初级的分类器时将全部的训练数据所对应的类别都记录下来，当测试对象的属性和某个训练对象的属性完全匹配时，便可以对其进行分类，但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢，其次就是存在一个测试对象同时与多个训练对象匹配，导致一个训练对象被分到了多个类的问题，基于这些问题呢，就产生了KNN。

下面通过一个简单的例子说明一下：绿色圆要被决定赋予哪个类，是红色三角形?还是蓝色四方形?如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形所属的类，如果K=5,由于蓝色四边形比例为3/5，因此绿色圆被赋予蓝色四边形类。

由此也说明了KNN算法的结果很大程度取决于K的选择。

以上内容为大家介绍了PythonK-近邻算法概述，希望对大家有所帮助，如果想要了解更多Python相关知识，请关注我们

培训下来初级数据近邻

首页 / 知识

Python K-近邻算法概述

最新内容

相关内容

热门文章

推荐文章

标签云

猜你喜欢