《数据挖掘:概念与技术》第三版原书PPT。该PPT虽然是英文版,但可与原书中文版对照着看,很好理解。
2023-02-22 12:34:57 21.04MB 数据挖掘
1
《数据挖掘:概念与技术(第三版)》 - 中文版 经典数据挖掘、机器学习教材,注意是可以复制内容的英文原版,非扫描版!
2023-02-22 12:24:01 32.65MB 数据挖掘
1
AG数据集:新闻主题分类数据集,用于文本分类。
2023-02-21 16:19:22 7.91MB 分类 数据挖掘 人工智能 机器学习
1
smote的matlab代码 DataMiningCase 流失预警模型(二分类),代码原型为本人在某银行做的流失模型,AUC:83%、召回率(覆盖率):19.4%,精确率:85%(数据是外部数据/代码已脱敏) 你将习得:数据的处理、LightGBM、sklearn包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、train_test_split单次数据切分等)、stacking模型融合、画AUC图、画混淆矩阵图,并输出预测名单。 告诉你:是什么(WHAT)、怎么做(HOW)、为什么这么做(WHY)。 注释覆盖率为80%左右,旨在帮助快速入门,新手级,持续更新,提供免费支持,只需要一颗star 该项目涉及的如下: 商业理解 数据理解 数据处理(数据准备) 特征工程(数据准备) 建立模型 模型融合 模型评估及实验 画图 说明 本专题并不用于商业用途,转载请注明本专题地址,如有侵权,请务必邮件通知作者。 本人水平有限,代码搬到外部环境难免有遗漏错误的地方,望不吝赐教,万分感谢。 有代码疑惑的地方也请找我。 Email:909336740@qq.c
2023-02-20 00:00:39 24.47MB 系统开源
1
基于数据仓库的web数据挖掘实例,对于那些初学者是一个很好的学习资料。
2023-02-19 22:35:51 350KB web数据挖掘
1
毕业设计基于Python的豆瓣网站数据爬取与可视化的设计与实现项目源码。通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来。毕业设计基于Python的豆瓣网站数据爬取与可视化的设计与实现项目源码。通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来。毕业设计基于Python的豆瓣网站数据爬取与可视化的设计与实现项目源码。通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来。毕业设计基于Python的豆瓣网站数据爬取与可视化的设计与实现项目源码。通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来。毕业设计基于Python的豆瓣网站数据爬取与可视化的设计与实现项目源码。通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来。
本课程资料系统介绍了商务智能的基础概念,商务智能的系统架构以及数据仓库,OLAP和数据挖掘等核心技术。在此基础上讨论了商务智能在电子商务,移动商务,知识管理,WEB挖掘,企业绩效等最新应用。
2023-02-13 00:33:16 24.12MB PPT
1
本项目是世卫组织建立了一段时间内所有国家健康状况的数据集,其中包括预期寿命,成人死亡率等方面的统计数据。使用此数据集,探索各种变量之间的关系,通过数据集建立模型对预期寿命进行预测以及找出对预期寿命的最大影响因素是什么? 本项目主要解决以下问题: - 最初选择的各种预测因素是否真的影响预期寿命?实际影响预期寿命的预测变量有哪些? - 预期寿命值低于(<65)的国家是否应该增加其医疗保健支出以改善其平均寿命? - 婴儿和成人死亡率如何影响预期寿命? - 是否接受教育对人类寿命有何影响? - 预期寿命与饮酒是正相关还是负相关? - 人口稠密的国家的预期寿命是否有降低的趋势? 数据集:数据/探索影响预期寿命的因素/Life Expectancy Data.csv 案例来源:https://www.kaggle.com/kumarajarshi/life-expectancy-who
2023-01-31 10:55:30 2.44MB 数据挖掘 机器学习 课程设计
1