人工智能-项目实践-创新大赛-基于python的用户贷款风险预测 融360与平台上的金融机构合作,提供了近7万贷款用户的基本身份信息、消费行为、银行还款等数据信息,需要参赛者以此建立准确的风险控制模型,来预测用户是否会逾期还款。 ##解决方案概述## 本题很多关键属性被脱敏处理,比如时间戳和所有金额的值,这个对我们进行特征构造带来很多的影响,损失了很多业务信息。不过对于参赛者都是公平的,因而我们构造了大量的统计特征,根据模型及线上反馈最佳特征大多来自用户浏览行为browse_history和bill_detail,此外发现放款时间也是个强力特征,详细见代码部分。这里只放了我个人的代码,队友的特征工程很多类似的,也有一些独特之处,这里说几个思路:bill_detail表的特征按放款时间分为放款前放款后分别统计(还可以尝试多划分几个时间窗再统计)、基于熵的分箱处理(特征离散化,熊掌整理了思路见:最优分箱.docx)、排序特征、组合特征等,有兴趣可以自己去实现。模型方面,我本人主要玩了xgboost和lightgbm,队友也基本上是xgboost、RandomForest,在玩Stack
2022-04-21 13:05:22 19.06MB 人工智能 python 贷款风险预测 风险预警
人工智能-项目实践-企业退出风险预测-基于python的企业经营退出风险预测,二分类问题 model: Xgboost 数据处理: pandas 文件夹结构介绍 data/alldata/: 存放所有的得到的数据文件 data/public/: 题目给定的原始数据 (https://pan.baidu.com/s/1nuJNz9B) 提取密码:t2ek 运行之前,请建立对应的文件夹,并导入数据。 model/:运行的model文件 feature/: 提取特征的py文件 saveModel/: 保存model,可以不使用 stack/: stacking特征的py文件 xresult/:存放输出结果的文件
2022-04-21 13:05:20 132KB 人工智能 企业退出风险 xgboost
人工智能-项目实践-主机被攻击风险预测-建立基于使用者特征的模型进行主机被攻击风险的预测 02.py 描述了数据属性重编码的方式,将原有的数据转换为数字形式的categorical类型的数据 dataInsight.py 描述了 读取数据集,重编码(独热编码,这部分我也是复制别人的),初始化神经网络,训练神经网络, 使用已训练的网络进行预测并计算评价指标,评价指标这部分我也是找的代码
中国典型设施栽培土壤Cu, Zn 累积特征及风险预测..pdf
2022-04-17 13:00:34 1.64MB 技术文档
糖尿病风险预测
2021-12-07 22:15:14 1.43MB JupyterNotebook
1
使用Java实现基于C4.5算法的决策树,实现银行贷款风险预测,包括对离散属性和连续属性的处理。适用于离散属性、连续属性共存的数据。
2021-11-05 21:56:15 6KB 机器学习 Java
1
2017-CCF-BDCI-Enterprise 这是我的第一个数据挖掘比赛,CCF 大数据与计算智能大赛(BDCI)中的一题:。最终取得复赛 A 榜第 3,B 榜第 9 (Top 1.58%) 的成绩。 这个比赛 12 月中旬就结束了,硬是被我拖到现在才来总结,我这拖延症真的是……现在回忆起这个比赛,比赛时的那种郁闷感依然记忆犹新。我在复赛的第 5 天便达到了分数 6924,但之后一直无法提分,这种烦躁感当时给我带来了挺大的困扰(当然最后还是提升到了分数 6930)。等比赛结束之后,我回过头来看,其实当时我参赛的心态是不端正的,功利心太强,这样带来的问题就是比赛心态的爆炸,自己的眼界会被约束,提分方式的想象力也会被限制。最好的心态应该是抱着学习的心态参赛,只要能够学到一点点新的东西,就会感到惊喜。 另外一个想说的点是,我们团队在复赛 A 榜中排名第 3,但是切换 B 榜之后,便跌到第 9
2021-10-27 09:53:53 21KB data-mining ccf binary-classification 2017
1
基于深度学习模型在疾病风险预测中的应用.pdf
2021-08-31 18:03:16 2.19MB 互联网 资料
基于深度学习模型在疾病风险预测中的应用.pdf
2021-08-20 01:39:58 2.18MB 深度学习 数据分析 数据研究 参考文献
业分类-物理装置-一种区域性桥梁风险预测方法及系统.zip