Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。
本资源使用基于Sklearn实现逻辑回归算法,同时提供了用于模型训练的数据集(信用卡数据集合),实现对是否存在信用卡欺诈行为进行检测。资源包括以下内容:
1、jupyter notebook程序源码
2、用于模型训练的数据集(csv文件)
3、使用混淆矩阵对测试结果进行评估
LR实现简单高效易解释,计算速度快,易并行,在大规模数据情况下非常适用,更适合于应对数值型和标称型数据,主要适合解决线性可分的问题,但容易欠拟合,大多数情况下需要手动进行特征工程,构建组合特征,分类精度不高。
LR直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题
LR能以概率的形式输出,而非知识0,1判定,对许多利用概率辅助决策的任务很有用
对率函数任意阶可导,具有很好的数学性质,许多现有的数值优化算法都可以用来求最优解,训练速度快
适用情景:LR是很多分类算法的基础组件,它的好处是输出。