银行营销数据分析 要求 Python 2.7 脾气暴躁> = 1.14.2 Matplotlib> = 2.2.0 熊猫> = 0.22.0 Scikit-Learn> = 0.19.1 描述 银行营销数据集是从葡萄牙语的一家银行机构的直接营销活动中收集的。 营销活动可以理解为打给客户的电话,说服他们接受他们向其银行存入定期存款。 每次通话后,他们被记为否-是客户未存入保证金,是-是通话中接受接受存入的客户。 该项目的目的是根据客户的信息预测应召客户是否愿意存入定期存款。 该项目考虑的银行营销数据集仅占全部可用数据集的一小部分(10%)。 该数据集包含约4119行数据,其中包含19个功能部件和1列Class信息。 数据集的主要问题是: 需要进行预处理以填充数据集中的未知值 需要进行预处理以决定分类数据和连续数据的使用 数据是类别不平衡的(与类别0的数量(否)相比,类别1
2021-10-14 23:03:03 4.92MB python random-forest pandas-dataframe histogram
1
陆振波老师工具箱,包括求时间延迟、嵌入维数、关联维、K熵、最大李雅普诺夫指数、盒子维等
2021-10-14 11:02:39 75KB 工具箱 混沌序列
1
下面介绍假设检验的F统计量的计算方法。 首先计算变截距、变系数模型(11.1.6)的残差平方和S1。如果记
1
NASA涡轮风扇故障预测 这个数据分析/机器学习项目研究了行为变量与故障发生之间的关系(就剩余的发动机循环而言),用于来自NASA研究项目的模拟运行涡扇数据。 该项目从对数据集的探索开始,随后是基于当前引擎读数的引擎剩余使用寿命(RUL)预测模型的开发。 建模技术包括线性回归和神经网络(使用TF-Keras)。 培训数据来自NASA预测中心数据存储库: : 可以在以下找到有关此调查的文章: : 项目目标 分析发动机性能与剩余使用寿命之间的关系。 开发剩余使用寿命的预测模型。 探索数据集 使用Jupyter笔记本浏览数据集,先进行数据质量检查,然后调查可变关系。 数据质量通常非常好,几乎没有数据丢失或数据类型不正确的情况,尽管随附的文档表明某些传感器上存在噪声。 在数据集中可以看到许多变量之间的强线性相关性,为子集预测模型的变量提供了坚实的基础: 许多变量分布是正态或偏态
2021-09-15 20:15:09 48.83MB JupyterNotebook
1
2020年可再生能源报告:分析和预测至2025年.pdf
2021-09-14 16:02:22 1.33MB
时间序列建摸的两种基本假设
2021-09-12 10:28:16 926KB 时间序列
1
针对云平台无法从单变量负荷序列中获取完整预测信息的问题, 提出了一种基于主成分分析的多变量局域预测模型并应用于云计算底层资源的预测中。利用主成分分析法综合考虑多种底层资源间的影响关系, 确定多变量相空间的嵌入维数, 并与局域预测法相结合, 由此建立多变量局域预测模型。仿真实验表明, 基于主成分分析的多变量局域预测模型的预测精度高于单变量局域预测模型, 是面向云计算底层资源预测的一种有效方法。
1
动态水环境容量分析及预测,焦丛丛,,本文采用一维动态水力学模型,一维动态水质模型,为水环境容量计算提供初始条件,并以淮河流域某年的纳污能力为算例,得出动态水
2021-09-08 15:09:00 245KB 首发论文
1
预测长江水质的模糊层次分析法权重确定程序MATLAB
2021-09-07 09:36:00 544B 数学建模
1
温度预测 预报温度的时间序列分析
2021-09-03 12:27:06 1.13MB JupyterNotebook
1