足球数据 来自各种网站/ API的足球数据包装器的集合。 您将获得:具有合理的,匹配的列名和跨数据集的标识符的Pandas数据帧。 数据在需要时下载并本地缓存。 示例Jupyter笔记本位于Github存储库中。 足球,如果你是异教徒 数据源: fourthirtyeight.com ( ) 2016-17赛季欧洲和美国顶级联赛的预测和结果。 数据不再在fourthirtyeight.com上可用,我已将其 football-data.co.uk ( ) 英国,苏格兰,德国,意大利,西班牙,法国,荷兰,比利时,葡萄牙,土耳其和希腊联赛的历史成绩,赔率和比赛统计数据,包括多个较低级别的联赛。 详细程度取决于联盟。 clubelo.com ( http://clubelo.com ) 所有(?)欧洲联赛的一线队相对实力。 每回合后重新计算,包括历史记录。 路线图: 添
2022-05-19 10:13:45 2.09MB python data-science pandas soccer
1
柱状晶体 python计算物理框架。 仅运行Crystal,VASP,ewald,jobs和数据库模块所必需的pylada的最小版本 由彼得·格拉夫(Peter Graf)从Mayeul d'Avezac的pylada建造 用法 笔记本子目录中有一些IPython笔记本。 可以在[联机]( )中找到文档,尽管有些过时了。 值得注意的是,它没有描述PWSCF包装器。 有关更多示例,请查看每个子文件夹中的测试,以及espresso / tests / bdd / features文件夹中的BDD方案。 最后,请加入[slack](pylada.slack.com)。 如果需要访问,请向其中一位作者发送电子邮件。 安装 最简单的方法是通过安装: 全局安装 pip install git+https://github.com/pylada/pylada-light 本地(用户)安装
2022-05-18 21:15:12 1.29MB science pipeline physics density-functional-theory
1
飞行延迟预测 介绍 延误是任何运输系统中最令人难忘的性能指标之一。 值得注意的是,民航业者将延误理解为航班延误或推迟的时间。 因此,延迟可以由飞机的起飞或到达的预定时间与实际时间之间的差异来表示。 国家监管机构有许多与航班延误的容忍阈值有关的指标。 实际上,航班延误是航空运输系统中必不可少的主题。 2013年,欧洲有36%的航班延误了超过5分钟,而美国有31.1%的航班延误了超过15分钟。 这表明该指标的相关性如何,以及无论航空公司网格的规模如何对其产生影响。 为了更好地了解整个飞行生态系统,每时每刻都会收集来自商业航空的大量数据并将其存储在数据库中。 淹没在传感器和物联网产生的大量数据中,分析人员和数据科学家正在增强其计算和数据管理技能,以从每个数据中提取有用的信息。 在这种情况下,理解领域,管理数据和应用模型的过程被称为数据科学,这是解决与大数据有关的挑战性问题的趋势。 在此项目中,我
1
OilMap-Web :world_map: :oil_drum: :glowing_star: 使用OilMap可视化国家地图上的石油数据 OilMap是一项独立的计划,旨在监视全球的石油和天然气行业,以提高决策和投资的透明度和问责制。 执照 此项目已获得MIT许可证的许可-有关详细信息,请参阅文件。 作者 Roque Leal-初步工作 社区 资质认证 ODI- *开放数据证书* -ODI 致谢 MapBox-地图-MapBox 灵感-大赦溢油-MapBox Labs
2022-05-17 21:04:45 1.38MB data-science world maps mapping
1
汽车价格预测-高度线性预测项目:一种线性回归模型,用于预测美国市场的汽车价格,以帮助新进入者了解美国汽车行业的重要定价变量。 高度全面的分析,详细说明所有步骤; 数据清理,探索,可视化,特征选择,模型构建,评估和MLR假设有效性
1
:incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。 数据源 安然电子邮件数据集 链接: : Python库 对于Fla
2022-05-10 22:47:54 42.02MB python flask data-science scikit-learn
1
欢迎使用ISI Web of Science-SCIE引文索引数据库.doc
2022-05-09 19:08:14 41KB 文档资料 前端 数据库 database
Accelerated_Computer_Science_Fundamentals_Specialization:Coursera上的Accelerated Computer Science Fundamentals专业化的一组实践和演示代码
2022-05-07 21:58:20 69.37MB python computer-science algorithm data-structures
1
电影_推荐系统 该项目存储库基于构建电影推荐系统克隆 数据集详细信息: 提及用于构建此推荐引擎的数据集如下: 使用的数据集: MovieLens数据集 下载数据集:从以下链接下载数据集 下载Kaggle上托管的MovieLens数据集,然后使用 从其官方网站下载MovieLens数据集,然后使用 数据集文件格式: CSV文件(以逗号分隔的值)。 注意:将数据集下载并保存在input_data文件夹中 数据集类型: 完整的数据集:该数据集包含26,000,000个评分和270,000个用户将750,000个标签应用程序应用于45,000部电影。 包括在1,100个标签中具有1200万相关分数的标签基因组数据。 注意:我们将使用完整数据集为电影建立一个简单的建议。 小型数据集:该数据集包含100,000个评分和1,700个标签应用程序,这些应用程序由700位用户应用于9,000部电影。
1
AP(Affinity Propagation)聚类聚类算法介绍(发表在Science杂志上)
2022-05-07 10:39:54 2.71MB 聚类算法
1