失踪
missingpy是一个用于在Python中丢失数据插补的库。 它具有与一致的API,因此,已经熟悉该界面的用户将发现自己处在熟悉的地形中。 当前,该库支持以下算法:
k最近邻插补
随机森林插补(MissForest)
我们计划在将来添加其他插补工具,因此请继续关注!
安装
pip install missingpy
1. k最近邻(kNN)插补
例子
# Let X be an array containing missing values
from missingpy import KNNImputer
imputer = KNNImputer ()
X_imputed = imputer . fit_transform ( X )
描述
KNNImputer类提供了使用k最近邻方法来完成缺失值的归因。 使用在训练集中找到的n_neighbors最近邻居的值来推算每个样本
2022-10-04 09:22:30
43KB
Python
1