MRMR
mrmr (最小冗余)是一种“最小最佳”特征选择算法,这意味着在给定(少量)特征的情况下,它试图找到能够提供最佳分类的特征集。
如何安装
您可以通过以下方式在您的环境中安装mrmr :
pip install git+https://github.com/smazzanti/mrmr
如何使用
您有一个由数字变量( X )和一个系列(二进制或多类)目标变量( y )组成的数据框。 您希望选择K个要素,以便它们具有最大的相关性,但又要使彼此之间的冗余度尽可能小。
from mrmr import mrmr_classif
from sklearn.datasets import make_classification
# create some data
X, y = make_classification(n_samples = 1000, n_features = 50,
1