分类 电信客户流失预测。 关于该项目- 在这个项目中,我使用各种分类算法,使用数据集中的特征预测客户流失率。 使用的Python软件包-Pandas,Numpy,Scipy,scikit-learn,Seaborn和matplotlib。 关于数据集: 每行代表一个客户,每列包含在元数据列中描述的客户属性。 数据集包含有关以下信息:上个月内离开的客户–该列称为每个客户都已注册的Churn Services –电话,多条线路,互联网,在线安全,在线备份,设备保护,技术支持和流媒体电视和电影客户帐户信息-他们成为客户的时间,合同,付款方式,无纸化账单,每月费用和总费用有关客户的人口统计信息-性别,年龄段以及是否有合作伙伴和受抚养人 致谢- 从下载了数据集 该项目涉及- 1)探索性数据分析-删除不必要的功能,处理空值和离群值(如果有)。 使用具有目标变量的独立特征的KDE图,箱线图和Ba
2022-06-13 22:52:11 318KB JupyterNotebook
1
Facebook互动预测器 使用机器学习预测Facebook页面帖子的喜欢,评论或全部互动 使用带有决策树的Adaboost回归器来预测帖子(如“顶”,“评论”等)的交互。 使用UCI的。 数据与2014年在著名化妆品品牌的Facebook页面上发布的帖子有关。 引文 (Moro et al。,2016)Moro,S.,Rita,P.,&Vala,B.(2016年)。 预测社交媒体绩效指标并评估对品牌建立的影响:一种数据挖掘方法。 商业研究杂志,69(9),3341-3351。
2022-06-13 11:16:03 134KB JupyterNotebook
1
电能 使用人工神经网络预测联合循环发电厂的电能输出(EP)。 特征包括每小时平均环境变量温度(T),环境压力(AP),相对湿度(RH)和排气真空(V),以预测工厂的每小时净电能输出(EP)。特征包括每小时平均周围环境变量-温度(T)在1.81°C和37.11°C的范围内-环境压力(AP)在992.89-1033.30毫巴的范围内-相对湿度(RH)在25.56%至100.16%的范围内-排气真空度(V )在25.36-81.56 cm Hg的范围内-每小时净电能输出(EP)420.26-495.76 MW
2022-06-12 20:53:48 1.93MB JupyterNotebook
1
内容:数据可视化 项目:诺贝尔奖获得者的视觉历史 安装 该项目需要安装Python 3.8.3和以下Python库: 您还需要安装软件才能运行和执行 数据 数据集csv文件: nobel.csv
2022-06-12 13:50:19 349KB JupyterNotebook
1
深度视觉注意力预测 该存储库包含Keras实现的“深度视觉注意力预测”论文,该论文发表在IEEE Transactions on Image Processing
1
Traditional Chinese Handwriting Dataset 繁体中文手写资料集 Preface 前言 In the way of data science, we believe every scholar, scientists might have heard about MNIST dataset, or played with Fashion MNIST. As a traditional Chinese user, we couldn't help but wonder: is it possible for machine learning, neural networks to recognize handwritten traditional Chinese characters? Let's challenge! 在走过资料科学的路上,相信每一位学者、
2022-06-11 21:38:29 76.7MB JupyterNotebook
1
双击文件即可。之后在任意文件夹下,右键选择Jupyter打开,即可显示当前目录的jupyter,而不必激活 Anaconda 环境启动 Jupyter Notebook,显示的反而在默认路径下。 Note:本文件的Anaconda安装在D:\Anaconda3,若你的不同则需修改路径。 以上
2022-06-11 18:09:17 584B 黑科技 python jupyter jupyternotebook
1
easySFS TL; DR-easySFS是用于有效选择人口规模投影以构建站点频谱的工具。 它可以用于将VCF转换为dadi / fastsimcoal / momi2样式的SFS,以进行人口统计分析。 为什么需要这个? 站点频谱不能以连贯的方式构造在缺少值的数据矩阵上。 数据丢失是类似于RADSeq的数据集的显着特征,仅删除缺失的站点将彻底丢弃大部分数据。 一个人也可以估算缺失的值,有些人这样做,但是如果您有很多缺失的数据,则估算将是不可靠的。 向下投影方法是这两个极端之间的一种折衷。 您可以“投影”到较小的样本大小,并“平均”所有可能的重采样以构建完整的数据矩阵。 需要明确的是,我没有发明这种向下投影的策略,我相信Marth等人2004年在这里得到了赞誉,我只是制作了这个用于自动探索投影值的python程序。 选择投影值 关于如何选择投影值,Gutenkunst等人2009提供了
2022-06-11 13:40:30 102KB JupyterNotebook
1
电影行业分析 问题和需要回答的问题: 行业趋势,市场规模和全球毛利润是多少? 盈利能力分析 谁是主要参与者及其最佳产品? 哪些类型和特定标题获得最高评价? 投资的平均收益是多少? 最有效的生产预算规模和类型是什么? 您如何获得最大的投资回报? 微软应该制作什么样的电影? 分析中使用的数据库 分析中使用的数据库包含在zippedData文件夹中,并在下面列出: tn.movi​​e_budgets.csv.gz tmdb.movi​​es.csv.gz rt.reviews.tsv.gz rt.movi​​e_info.tsv.gz imdb.title.ratings.csv.gz imdb.title.basics.csv.gz imdb.name.basics.csv.gz imdb.title.principals.csv.gz bom.movi​​e_
2022-06-09 18:31:35 46.95MB JupyterNotebook
1
Medical_Cost_Prediction:该项目预测了医疗病人的保险费用
2022-06-09 15:45:05 77KB JupyterNotebook
1