车价预测 车价回归 问题陈述 一家中国汽车公司吉利汽车(Geely Auto)希望通过在美国设立生产部门并在当地生产汽车,从而在美国和欧洲同行中竞争来进入美国市场。 他们与汽车咨询公司签约,以了解汽车定价所依赖的因素。具体来说,他们想了解影响美国市场汽车定价的因素,因为这些因素可能与中国市场有很大不同。该公司想知道: 哪些变量在预测汽车价格方面很重要 这些变量如何很好地描述汽车的价格 根据各种市场调查,这家咨询公司收集了整个美洲市场上各种类型汽车的大型数据集。
2022-11-18 23:06:14 958KB JupyterNotebook
1
糖尿病预测系统
2022-11-18 21:28:42 1.23MB JupyterNotebook
1
这项工作的目的是从字符和单词级别方面识别图像中的文本。 ———————————————————————————————————————————————— 此处使用的数据集包含每个手写单词的图像,并以短划线分隔的文件名格式。 第一个字段代表单词id,第二个字段代表单词分割的结果,第三个灰度级将包含该单词的行二值化,第四个字段围绕该单词,第四个边界框,第五个语法标记,第六个单词表示该单词的转录。 数据集是从以下链接下载的:“ (数据/字)—————— —————————————————————————————————————————— 模型:卷积神经网络和序列的融合,使用LSTM / GRU进行序列建模—————————————————————————————————— ———————————— 笔记本: Sequence2Sequence_LSTM.ipynb: Results
2022-11-18 21:17:50 120KB JupyterNotebook
1
老年痴呆症分类 圣克拉拉大学高级设计项目2020-2021的资料库 贡献者:切尔西·费尔南德斯(Chelsea Fernandes),艾尤西·库马尔(Aiyushi Kumar),什里亚·文卡特(Shreya Venkatesh) 数据预处理 我们的数据来自ADNI,我们从中预处理原始数据以输入到我们的模型中。 以下预处理已完成: 平均认知测试数据(Convert_Ecog_Test_Values.ipynb) 合并各种csv文件(adni_merge_data.ipynb) 合并数据的规范化(normalize_data_3.ipynb) 数据分析 为了确定要从我们的数据集中删除哪些功能,完成了以下操作: 绘制直方图(Histogram_plot_grp_1.ipynb) 为每个功能绘制的箱线图(boxplots.uptnb) k倍交叉验证(kfold_crossvalid
2022-11-17 14:31:56 979KB JupyterNotebook
1
帕金森预测因子 这个项目是一个教育项目,旨在加深我通过动手学习机器学习的知识。 在本笔记本中,您将看到我使用两种不同的分类策略来尝试根据存储库中也可以找到的数据集来预测某人是否患有帕金森氏病。 信息和渗透来自有关机器学习,深度学习和熊猫的公共kaggle课程。
2022-11-16 19:22:42 45KB JupyterNotebook
1
人脸识别 本项目代表对面部投影技术(PCA,ICA和LDA)的比较分析,旨在比较使用公平意识训练对这些模型的性能影响的程度。 该技术在FERET图像数据集的两个450图像子集上进行了测试,一个旨在保留美国人口的种族构成(70%的白种人,20%的非洲人,10%的东南亚人),而其他人的种族背景分布均匀(33%的白人,33%的非洲人,33%的东南亚人)。 这两个数据集每个类(人)都包含两个图像,旨在模拟法律规范应用,其中每个人的可用图像数量预计会很少。 培训方法基于[1]中使用的方法。 首先通过均值减法和标准化对训练图像进行预处理。 然后执行PCA,得到一个180维子空间(450的40%),该子空间在受人口影响的数据中分别保留99.66%的信息,在公平意识的数据中分别保留99.68%的信息。 然后将这些预测用作ICA和LDA的输入数据。 生成的空间用于投影以前看不见的图像,并通过将它们与同一个
1
欢迎来到我的Apple图片分类项目 在这个项目中,我探索了如何使用CNN和转移学习来建立图像分类器。 数据集包含从Google Image的“ iPhone”,“ iPad”和“ Macbook”的最高搜索结果中抓取的1500张图像。 完整的数据集可以在这里下载: : 。 目的是尝试创建图像分类器,以区分3种最主流的Apple产品-iPhone,iPad和Macbook。 从表面上看,它们可能会彼此混淆(没有缺口的旧版iPhone设计可能会误认为iPad,而带有键盘的新版iPad可能会误认为Macbook)。 虽然我们可以轻松区分它们,但我们可以教一个深度学习模型来做到这一点吗? 哪种方法可以使我们获得最高的准确性? 这些是将在本项目中回答的问题。 档案说明 该存储库中只有4个文件(自述文件和需求文件除外)。 该笔记本是一款Jupyter笔记本,可以在Google Colab(带有
2022-11-15 10:52:21 66.94MB JupyterNotebook
1
FIFA-worldcup-2018-预测 使用机器学习预测2018年FIFA世界杯冠军。 这是我的第一个练习数据挖掘和机器学习技术的个人项目。 我主要使用熊猫,seaborn和scikit-learn。 请随意查看回购中的Jupyter Notebook,以检查代码和提供的见解。 我希望它足够讲道理! 如何可视化Jupyter Notebook的所有荣耀 确保已安装Jupyter笔记本( )。 在此存储库中,按绿色的“克隆”或“下载”按钮。 确定是要克隆存储库还是将其下载为.zip(如果您不熟悉Github,建议您以.zip下载)。 打开Jupyter Notebooks应用程序。 浏览器中的选项卡将打开。 导航到保存该存储库的文件夹。 单击“ Predicting World Cup 2018 Winner.ipynb文件将其打开。 它应该工作! 现在,您可以浏览代码,运
2022-11-13 23:11:17 1.17MB JupyterNotebook
1
2020年人口基因组学 描述 课程结束后,学员将对进行典型人群基因组研究所需的方法和应用有详细的了解。 参加者必须在课程结束时能够: 确定与种群基因组分析相关的实验平台。 应用常用的种群基因组方法。 解释常见种群基因组方法背后的理论。 反思种群基因组方法的优势和局限性。 解释和分析总体基因组推论的结果。 根据数据制定人口遗传学假设 该课程介绍了人口基因组学中的关键概念,从生成种群遗传数据集到最常见的种群遗传分析和关联研究。 本课程的第一部分着重于群体遗传数据集的生成。 第二部分介绍了最常见的群体遗传分析及其理论背景。 这里的主题包括人口统计分析,人口结构,重组和选择。 本课程的最后一部分着重于人口遗传数据集在与人类健康相关的关联研究中的应用。
2022-11-13 21:01:45 19.3MB JupyterNotebook
1
使用Logistic回归的糖尿病分类模型 据估计,全世界有4.15亿人患有糖尿病,估计占世界成年人口的11分之一。 46%的糖尿病患者未被诊断。 作为“彩色计算机视觉编码器”课程的一部分,我们学习了许多不同的机器学习算法,以及如何将它们用于解决现实世界中的问题。 对于实用分类,我选择浏览包含糖尿病最常见症状的糖尿病数据集。 我的模型能够弄清楚“多尿症”和“多尿症”是最常见的糖尿病指标。 我用来解决此任务的方法是: 数据集 数据上传到AWS S3- 建立 用法
2022-11-12 19:42:38 1.16MB JupyterNotebook
1