这是一个完整的,端到端的机器学习项目,非常适合有一定基础后拿来练习,以提高对完整机器学习项目的认识
2021-12-22 12:08:21 7.27MB Python开发-机器学习
1
汉森预测市场 汉森对数市场得分规则做市商,预测市场的模拟 建立Hanson的市场预测规则预测市场的一种实现。 包括竞标者与市场互动的模拟,并创建异步的“买卖”账簿以及市场结果。
2021-12-20 18:05:28 5KB R
1
大数据背景下网络调查样本的随机森林倾向得分模型推断研究 本文提出网络调查样本的随机森林倾向得分模型推断方法,通过构建若干棵分类决策树组成随机森林,对网络调查样本单元的倾向得分进行估计,从而实现对总体的推断。模拟分析和实证研究结果表明:基于随机森林倾向得分模型的总体均值估计的相对偏差、方差与均方误差均比基于Logistic倾向得分模型的总体均值估计的相对偏差、方差与均方误差小,提出的方法估计效果更好。
2021-12-19 18:09:48 1.11MB 大数据 网络样本 随机森林 倾向得分
本人课程设计代码,Linux上直接运行,代码注释详细,其中有详细的函数运行解释,很容易看懂,本人原创代码,有自己的特色,容易拿高分,也容易修改
2021-12-17 11:01:40 35KB Linux实时聊天室 原创 得分95+
1
基于ESG得分的股票选择和投资组合绩效分析 概括 该分析研究了在标准普尔500指数中选择证券所构建的投资组合的绩效。股票选择基于行业和ESG得分。投资组合中的股票具有同等的权重,并且将表现与标准普尔500指数中所有证券的同等权重基准进行比较。 数据 Yahoo Finance提供有关价格,行业和ESG得分等财务信息的信息 标准普尔500指数证券列表的Datahub 笔记本 参考
2021-12-11 15:51:13 6.44MB JupyterNotebook
1
NBA球员数据 ============== 活跃职位 统计抓取 ESPN 拥有每场 NBA 比赛的统计数据。 这将被访问并存储在数据库中。 夜间领袖 将选出得分、篮板和助攻类别的前 3 名统计领先者。 然后它们将被编译成电子邮件模板并发送出去。 贡献 确保在贡献之前安装了最新版本的 克隆存储库后,在本地目录中运行npm install命令。 所有贡献者都应遵循教程中所述的工作。 问题 任何潜在的代码更改都必须有相关的问题。 对于大量工作,问题应分解为最简单的描述; 任何问题都不应该是微不足道的,不需要任何工作,但问题不应如此复杂,以至于贡献者无法轻松理解解决步骤。 每个问题都应标记为增强功能或错误,但不能同时标记两者。 就本项目而言,增强表示任何全新的功能或代码。 错误是对现有代码逻辑的任何更改。 分枝 相关功能应该在master一个独特分支上开发。 分支名称应简短且具有描述性。
2021-12-10 20:36:41 4KB JavaScript
1
在一个圆形操场的四周摆放着n 堆石子。现要将石子有次序地合并成一堆。规定每次只 能选相邻的2堆石子合并成新的一堆,并将新的一堆石子数记为该次合并的得分。试设计一 个算法,计算出将n堆石子合并成一堆的最小得分和最大得分
2021-12-10 09:08:56 2KB 合并 最大得分 最小得分
1
安然欺诈项目 休斯顿的安然综合体- 安然是美国最大的公司之一。 由于公司欺诈,它破产了。 由于联邦调查的结果,大量的安然数据(电子邮件和财务数据)已进入公共记录。 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 选型 特征选择与工程 首先,清理数据; 由于我们对个人数据感兴趣,因此删除了与“总计”和“公园旅行社”相对应的数据。 另外,“ LOCKHART EUGENE E”数据全为零,并且也被删除。 一些功能也被删除。 由于“ to
2021-11-21 19:00:23 2.77MB python machine-learning random-forest scikit-learn
1
ngram-相似性 计算两个文件之间基于 n-gram 的相似度分数。
2021-11-09 19:47:18 9KB Java
1