组套索
组套索正则化器是一种在机器学习和统计中实现结构化稀疏性的众所周知的方法。 这个想法是创建协变量的非重叠组,并恢复其中只有这些协变量组的稀疏集合具有非零分量的回归权重。
有几个原因说明为什么这可能是一个好主意。 例如,假设我们有一组传感器,并且这些传感器中的每一个都会生成五个测量值。 我们不想保留不必要的传感器数量。 如果我们尝试正常的LASSO回归,那么我们将获得稀疏分量。 但是,这些稀疏分量可能不对应于一组稀疏传感器,因为它们各自生成五个测量值。 如果我们改为使用LASSO组,并将测量结果按被测量的传感器分组,那么我们将获得一组稀疏的传感器。
组套索正则化器的扩展是稀疏组套索正则化器 ,它强加了按组稀疏性和按系数稀疏性。 这是通过将组套索罚分与传统套索罚分相结合来完成的。 在该库中,我实现了一个完全兼容scikit-learn API的高效稀疏组套索求解器。
关于这个项目
2021-10-15 16:43:44
43KB
Python
1