上传者: jyxmust
|
上传时间: 2021-11-06 13:09:49
|
文件大小: 199KB
|
文件类型: -
机器学习异常值处理,数据预处理之异常值处理
一、什么样的值是异常值?
简单来说,即在数据集中存在不合理的值,又称离群点。
我们举个例子,做客户分析,发现客户的年平均收入是80万美元。 但是,有两个客户的年收入是4美元和420万美元。 这两个客户的年收入明显不同于其他人,那这两个观察结果将被视为异常值。
二、什么会引起异常值呢?
每当我们遇到异常值时,处理这些异常值的理想方法就是找出引起这些异常值的原因。 处理它们的方法将取决于它们发生的原因, 异常值的原因可以分为两大类: