通过多模型监督学习算法进行收入预测 寻找慈善捐助者 胡安·罗隆(Juan E.Rolon),2017年 项目概况 在此项目中,我采用了几种监督算法,以使用从1994年美国人口普查中收集的数据准确地预测个人收入。 我们执行各种测试过程,以从初步结果中选择最佳候选算法,然后进一步优化该算法以对数据进行最佳建模。 此实现的主要目标是构建一个模型,该模型可以准确地预测个人的收入是否超过50,000美元。 在非营利机构中,组织可以靠捐赠生存,这种任务可能会出现。 了解个人的收入可以帮助非营利组织更好地理解要请求的捐赠额,或者是否应该从一开始就伸出援手。 虽然直接从公共来源确定个人的一般收入等级可能很困难,但我们可以从其他公共可用功能中推断出此价值。 该项目是从Udacity获得机器学习工程师Nanodegree所需条件的一部分。 安装 此项目需要Python 2.7和已安装的以下Python
1
3rd Edition - Probability, Random Variables and Stochastic
2022-06-08 19:15:54 48.21MB Probability Random
1
解决了世纪难题,随机选择今天吃什么,下载后,直接使用就行了
2022-06-07 16:44:14 1KB random
1
Nyc-Taxi-Kaggle-挑战 目标 Kaggle竞赛预测纽约出租车的行驶时间。 该项目的报告在capstone.pdf。 (在这个项目中,我提供了许多链接,如果您是初学者,可以通过这些链接来弄清楚您的概念,如果不理解的话,可以通过project和readme中提供的链接和pdf来了解。) 问题陈述 在本报告中,我们使用来自纽约市出租车和高级轿车委员会的数据来考察Kaggle竞赛,该竞赛要求竞争对手预测纽约市出租车旅行的总行驶时间(trip_duration)。 Kaggle提供的数据是作为CSV文件提供的结构化数据。 CSV文件中的数据包括多种格式:时间戳,文本和数字数据。 这是回归分析,因为输出(总行驶时间)是数字。 我将使用几种机器学习方法来完成预测任务,这些方法是线性回归,k最近邻回归,随机森林和XGBoost。 将使用均方根对数误差对模型进行评估。 总览 我使用Jupyter_Notebook在dekstop上执行此项目,并且在使用python的远程服务器上也无需使用Jupyter_notebook来执行。 软件和库 Python 3 Scikit-learn:Pyt
2022-06-05 16:04:07 23.28MB python machine-learning deep-learning random-forest
1
代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random graph算法程序代码 复杂网络random gra
2022-06-04 18:06:59 2KB 网络 算法 代码复杂网络randomgr
esearchers in spatial statistics and image analysis are familiar with Gaussian Markov Random Fields (GMRFs), and they are traditionally among the few who use them. There are, however, a wide range of applications for this methodology, from structural time-series analysis to the analysis of longitudinal and survival data, spatio-temporal models, graphical models, and semi-parametric statistics. With so many applications and with such widespread use in the field of spatial statistics, it is surprising that there remains no comprehensive reference on the subject. Gaussian Markov Random Fields: Theory and Applications provides such a reference, using a unified framework for representing and understanding GMRFs. Various case studies illustrate the use of GMRFs in complex hierarchical models, in which statistical inference is only possible using Markov Chain Monte Carlo (MCMC) techniques. The preeminent experts in the field, the authors emphasize the computational aspects, construct fast and reliable algorithms for MCMC inference, and provide an online C-library for fast and exact simulation. This is an ideal tool for researchers and students in statistics, particularly biostatistics and spatial statistics, as well as quantitative researchers in engineering, epidemiology, image analysis, geography, and ecology, introducing them to this powerful statistical inference method.
2022-06-02 22:48:58 9.85MB Gaussian Markov Random Fields
1
很棒的决策树研究论文 精选的决策,分类和回归树研究论文清单,包括来自以下会议的实现: 机器学习 计算机视觉 自然语言处理 数据 人工智能 关于,,,和论文的类似集合以及实现。 2020年 DTCA:可解释的索赔验证基于决策树的共同注意网络(ACL 2020) 吴连伟,袁Yuan,赵永强,梁浩,安布琳·纳齐尔 隐私保护梯度提升决策树(AAAI 2020) 李勤彬,吴兆敏,温则宜,何炳生 实用联合梯度提升决策树(AAAI 2020) 李勤彬,温则宜,何炳生 最优决策树的有效推断(AAAI 2020) 弗洛伦特·阿韦拉内达(Florent Avellaneda) 使用缓存分支和边界搜索学习最佳决策树(AAAI 2020) 盖尔·阿格林(Gael Aglin),齐格弗里德·尼森(Pierre) 决策树集合分类器的抽象解释(AAAI 2020) 弗朗切斯科·朗佐托(Marco Zanella) (多任务)梯度增强树的可扩展功能选择(AISTATS 2020) Cuize Han,Nikhil Rao,Daria Sorokina,Karthik Subbia
1
先给大家介绍下python中random模块 random与numpy.random对比: 1、random.random():生成[0,1)之间的随机浮点数; numpy.random.random():生成[0,1)之间的随机浮点数; numpy.random.random(size=(2,2)),生产一个2维的随机数组,每维2个随机数,数据区间[0,1) 2、random.randint(a,b):生产[a,b]之间的随机整数; numpy.random.random(1,5,5):返回一个一维数组,共计5个元素,数据区间为[1,5) numpy.random.random(1,5,(2
2022-05-22 20:53:51 43KB AND do dom
1
Random sampling of bandlimited signals on graphs.zip
2022-05-20 15:48:55 2.46MB
1
从零开始的应用概率论 数据和幻灯片与在线网络研讨会系列一起提供:Data For Science的 。 在Binder中运行代码: 机器学习和人工智能的最新进展引起了计算机科学和数学这两个领域的极大关注和兴趣。 这些进步和发展中的大多数都依赖于随机模型和概率模型,需要对概率论以及如何将其应用于每种特定情况有深入的了解。 在本讲座中,我们将以动手和渐进的方式介绍概率论的理论基础以及诸如工业和学术界实际应用中常用的马尔可夫链,贝叶斯分析和A / B测试等最新应用。 时间表 基本定义和直觉 了解什么是概率 计算不同结果的可能性 根据特定的概率分布生成数字 根据样本估算种群数量 随机游走和马尔可夫链 模拟一维随机游走 了解网络上的随机游走 定义马尔可夫链 实施PageRank 贝叶斯统计 了解条件概率 派生贝叶斯定理 了解如何更新信仰 A / B测试 了解假设检验 测量p值 比较两个结果的可能
2022-05-19 13:13:48 33.79MB machine-learning tutorial markov-chains random-walk
1