国家援助的聚类分析 聚类 国际帮助非政府组织是一个国际人道主义非政府组织,致力于在贫困和自然灾害期间与贫困作斗争,并为落后国家的人民提供基本的便利和救济。 它不时运行许多运营项目,并开展宣传活动以提高知名度和筹集资金。 经过最近的资助计划,他们已经能够筹集到大约1000万美元。 现在,非政府组织的首席执行官需要决定如何从战略上有效地使用这笔钱。 做出此决定时出现的重大问题主要与选择急需援助的国家有关。 这就是您成为数据分析师的地方。 您的工作是使用决定国家总体发展的一些社会经济和健康因素对国家进行分类。 然后,您需要建议首席执行官最需要关注的国家。
2021-12-12 14:19:49 3.05MB JupyterNotebook
1
环法自行车赛数据集的分析和可视化
2021-12-12 14:18:56 164KB JupyterNotebook
1
RL_in_Finance 强化学习在量化金融上的应用
2021-12-12 11:50:14 1.58MB JupyterNotebook
1
高斯过程回归的直观教程 ,女王大学的,加拿大金斯敦 笔记本可以在以下位置执行 笔记本的: @misc{wang2020intuitive, title={An Intuitive Tutorial to Gaussian Processes Regression}, author={Jie Wang}, year={2020}, eprint={2009.10862}, archivePrefix={arXiv}, primaryClass={stat.ML} } 本教程的读者是想使用GP但又不适应GP的人。 在阅读完教科书《高斯机器学习过程》 [ ]的前两章后,我发生了这种情况。 由于难以理解该理论,因此GP的使用与使用它之间存在差距。 当我在线阅读教科书和观看教程视频时,我可以毫无困难地跟随大多数人。 内容对我来说很有意义。 但是,即
2021-12-12 11:01:33 32.01MB JupyterNotebook
1
房屋净值贷款 房屋净值贷款(HMEQ)报告5960份房屋净值贷款的特征和欠款信息。 房屋净值贷款是指债务人将其房屋净值用作基础抵押品的贷款。 在这个项目中,我们预测贷款违约的可能性。 数据集包含两个类别-多数(否定)类别包含80%的观察值,代表按时还清贷款的申请人,数据集的20%为少数(正面)类别,代表未按时偿还贷款的申请人贷款。 数据集在某些变量中还包含一些缺失值,这些缺失值是在建模之前进行估算的。 我们建立了四个监督分类模型:逻辑回归,支持向量机,随机森林和XGBoost。 ROC曲线下的面积(AUC)被用作所有模型的性能指标。 属性信息 坏:1 =申请人拖欠贷款或严重拖欠款项; 0 =申请人支付的贷款 贷款:贷款申请额 MORTDUE:现有抵押贷款的应付金额 VALUE:当前属性的值 原因:DebtCon =债务合并; HomeImp =家装 职位:职业类别 YOJ:现任工作年限
2021-12-11 22:29:40 10.14MB JupyterNotebook
1
环境,社会及管治研究 此存储库包括为ESG研究项目创建的代码,数据集和其他资源。该项目主要侧重于比较不同ESG指标的方法论,并研究它们在中国市场的适用性。代码由刘易斯田( )提供 有关此项目的更多信息,请访问sites.duke.edu/esgindex
2021-12-11 15:54:36 298KB JupyterNotebook
1
基于ESG得分的股票选择和投资组合绩效分析 概括 该分析研究了在标准普尔500指数中选择证券所构建的投资组合的绩效。股票选择基于行业和ESG得分。投资组合中的股票具有同等的权重,并且将表现与标准普尔500指数中所有证券的同等权重基准进行比较。 数据 Yahoo Finance提供有关价格,行业和ESG得分等财务信息的信息 标准普尔500指数证券列表的Datahub 笔记本 参考
2021-12-11 15:51:13 6.44MB JupyterNotebook
1
所有ML算法 它包括所有ML模型。(用于KTM和银行数据) 由所有ML预处理技术组成,如a。 采样技术(欠采样,过采样-ROS和SMOTE)b。 交叉验证(K折,分层K折)c。 主成分分析 具有HYPER参数校正的Boston数据集的套索和岭回归。 该存储库还包含我在编码文件中使用的RAW数据文件
2021-12-11 01:12:55 577KB JupyterNotebook
1
动手人工智能实现网络安全 这是Packt发布的《 的代码库。 实施智能AI系统以防止网络攻击并检测威胁和网络异常 这本书是关于什么的? 如果您希望使用流行的AI工具和技术来设计智能,防威胁的网络安全系统,那么本书非常适合您。 通过本书,您将学习开发可以检测可疑模式和攻击的智能系统,从而保护您的网络和公司资产。 本书涵盖以下激动人心的功能: 使用AI检测电子邮件威胁,例如垃圾邮件和网络钓鱼 分类APT,零时差和多态恶意软件样本 克服威胁检测中的防病毒限制 通过机器学习预测网络入侵并检测异常 通过深度学习验证生物认证程序的强度 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代码都组织在文件夹中。 例如, 该代码将如下所示: In [ ]: from sklearn.decomposition import PCA pca = PCA(n_components=2)
2021-12-10 21:53:25 1013KB JupyterNotebook
1
客户流失项目 使用电信客户流失数据确定功能重要性 杰夫·斯帕格诺拉 笔记: 该自述文件正在进行中,将很快完成。 介绍 客户流失是任何业务的主要关注点。 在当今世界,客户比以往任何时候都更加了解信息,并且只需在移动设备上轻按几下即可找到各种服务的优惠和促销。 使用有针对性的社交媒体广告,他们甚至不必这样做! 当客户管理中的任何失误都可以使忠诚的客户跳船寻求其他地方的更好报价时,仅凭这一事实就比以往更难创建长期客户。 在电信市场竞争如此激烈的情况下,许多公司遇到客户流失给竞争公司的问题也就不足为奇了。 通常,并非100%清楚为什么这些客户放弃了他们目前的提供商而去了另一家。 在这个项目中,我们将使用数据分析和机器学习来找出哪些因素最会影响客户决定将其服务提供商移交给竞争对手的决定。 获得 数据来自Kaggle的Churn In Telecom数据集。 关于Kaggle的信息不多于数据
2021-12-10 20:06:11 1.31MB JupyterNotebook
1