奥林匹克运动会分析 奥运会分析(1896-2018)输入:奥运会参与者和赛事的非结构化数据输出:不同指标的结构化数据集和分析,包括体育/运动员/国家/地区的奖牌数量,运动员的平均身高/年龄等。 包括可视化和执行摘要
2023-04-13 00:01:17 158KB JupyterNotebook
1
Metis数据科学训练营| 项目3 预测贷款人关于房屋贷款再融资申请的决定 分类分析 项目时间表:三周 最终演讲在发布。 介绍 全美房地产经纪人协会(National Association of Realtors)预期利率在2020年仍将保持在较低水平。迄今为止,抵押贷款利率已接近创纪录的低点,这表明经济仍在继续挣扎。 这种利率环境对那些寻求再融资以减轻财务负担的人来说是有利的。 因此,最好尽快申请再融资以确保较低的利率。 理解贷方着重于制定决策的财务特征以及这些特征如何在批准或拒绝申请中发挥作用是有益的。 该项目使用机器学习方法解决了这些问题。 首先,该数据是从《房屋抵押信息披露法》(HMDA)查询网站收集的。 其次,在初始数据清除后,使用5倍交叉验证的随机森林模型进行特征选择,以识别重要的财务特征。 完成此步骤后,将使用所有训练数据以及所选特征来训练随机森林模型。 由于随机森林模型
2023-04-11 23:13:37 19.85MB JupyterNotebook
1
机器人大师 计划是由Da-Jiang Innovations(DJI)建立的机器人竞赛和学术交流平台,专门为全球技术爱好者设计。 在比赛中,两支团队的机器人通过在安装在机器人上的装甲板上射击小球,在竞技场上相互搏斗。 机器人上广泛使用计算机视觉来跟踪和检测对手机器人并执行自动瞄准和射击。 可以同时检测蓝色和红色装甲 该模型使用框架进行训练,并预先训练了微小的yolov4权重。
2023-04-11 17:39:35 222.35MB JupyterNotebook
1
逆变换样本v1.1 逆变换样本是一项技术的简单Python实现,该技术允许从任意概率密度函数中进行抽样。 安装 要安装,请执行 git clone https://www.github.com/peterewills/itsample /path/to/itsample 用法 要使用该软件包,您必须将其位置添加到Python路径中。 可以在解释器中完成以下操作 >> import sys >> sys.path.append('/path/to/itsample') 采样器可以按以下方式使用: >> import numpy as np >> pdf = lambda x: np.exp(-x**2/2) # unit Gaussian, not normalized >> from itsample import sample >> samples = sample(pdf,100
2023-04-11 17:01:39 47KB JupyterNotebook
1
自然语言处理 我在这里分享了我在IE Univesity的自然语言处理课程中使用的一些代码。 我也分享我所做的项目。 1.计算歌曲的词汇多样性 我遇到一篇文章,讨论一些音乐家在其职业生涯中的整体词汇。 因此,我想将清单上前3位歌手和最后2位歌手的歌曲与我们在课堂上看到的3首歌曲进行比较。 排在首位的是Eminem(毫不奇怪),他的100首最慢的歌曲中使用了大约8,800个单词。 然后是Jay Z(6,900字)和Tupac Shakur(6,600字)。 排在最末的是Spice Girls和Bruno Mars(大约1500个单词)。 我尝试选择看起来在词汇上更加多样化的歌曲,并且与预期的一样,结果表明两组之间的差异很大,而且与我们看到的三首歌曲相比,差异也很大。 (可以在文件1_Lexical_Diversity中找到该代码) 2.分类模型:真实与否? NLP与灾难鸣叫 我们获得了将近1
2023-04-11 16:46:54 7.42MB JupyterNotebook
1
School_District_Analysis 使用Anaconda进行学区分析的项目
2023-04-11 13:38:08 1.48MB JupyterNotebook
1
ODIR 我们提交给Kaggle的眼部疾病智能识别(ODIR)问题,作为ENEL 610的最终项目。 作者- 阿迪亚·波瓦尔(Aditya Porwal) 斯帕什·梅塔(Sparsh Mehta) 电气与计算机工程系卡尔加里大学加拿大艾伯塔省。 代码运行说明 代码重现性的逐步 : 可以在这里找到代码:
2023-04-10 16:25:42 2.69MB JupyterNotebook
1
使用CNN的蘑菇识别分类器 目标: 该项目的目的是创建一个工具,该工具能够对来自大约1000种不同流行蘑菇种的蘑菇图片进行分类。 介绍: 蘑菇是重要的食物来源,并且在烹饪中被广泛使用,在许多美食中(特别是中国,韩国,欧洲和日本)。 此外,许多人喜欢户外活动来收集蘑菇。 但是,这种活动带来一些健康风险,因为某些有毒物质物种看起来与可食用标本相似。 在下面的示例中,我介绍了美味可食用的蘑菇Macrolepiota mastoidea和鹅膏菌鹅膏菌之间的相似性,这种摄入会导致死亡。 因此,辨别哪些蘑菇可以安全采摘是很重要的。 在本笔记本中,我将训练一种算法,该算法可以帮助我们对蘑菇种类进行分类。 使用的代码和资源: 的Python版本:3.7 使用的软件包:pandas,numpy,csv,bing_image_downloader,simple_image_download,pat
2023-04-10 14:11:28 22.59MB JupyterNotebook
1
蛋白质金属结合位点预测 投稿人:田秋,郑子涵,金文浩 生物学意义: 蛋白质及其结构是生命中生物学功能的关键。 通过翻译,核糖体将延长氨基酸序列链,这些氨基酸的物理化学特性及其相互依赖性使一级结构折叠成其复杂的三级结构。 一旦建立了结构,蛋白质结构可能会允许某些离子结合,这可能导致该结构通过构象变化更稳定,或有助于催化。 例如,锌指稳定结构,或血红素基团中离子的必要性,以使血红蛋白转运氧气。 另外,结合位点的序列和结构往往在整个世代中都被保守,并且来自蛋白质数据库(PDB)的大约1/3的蛋白质结构包含金属离子这一事实可能表明它显着干预了蛋白质的行为。 目标 : 我们的兴趣是利用一个突出的神经网络来识别哪些金属与哪个序列结合,以及该金属与哪些氨基酸特异性结合。 我们的目标是将金属分类为准确度为95%的序列。 我们的目标是对哪些氨基酸与F1分数达75%的金属结合进行分类。 概述: [
2023-04-09 12:39:17 316.17MB JupyterNotebook
1