福布斯学院分析 使用:美国顶级大学排名的基本分析(福布斯,2019) 我将使用由福布斯(Forbes)编译的开源数据集,该数据集分析美国650强大学的排名。 该数据集提供了多个数据点的广泛而准确的视图,这些视图清楚地显示了这些大学提供的教育质量。 该数据集中提供了位置,排名,使用的补助金,学生/校友人数和学费。 我的目标是使用这些排名来深入了解被分析类别的机​​构(针对每个假设)所提供的总体价值。 将保持对公共机构与私人机构的特别关注。 将检查数据点之间的多重相关性以做出这些观察。 参考值将与学生及其家人作为听众进行研究。 学生及其家庭是大学的“客户”,我想提供可供参考的类别的学校可以参考的见识,以吸引这些客户。 该数据旨在用于吸引将来的学生使用某一类别机构提供的价值。 此数据旨在进行分类,而不是特定于机构。 本·史蒂文斯
2022-05-30 15:51:53 176KB JupyterNotebook
1
对目前主流的机器学习算法进行公式推导、问题分析以及代码实现(主要基于numpy),持续更新(下面链接如果加载不出来,对应内容可在notebooks文件夹下找到): 01_线性模型_线性回归 01_线性模型_线性回归_正则化(Lasso,Ridge,ElasticNet) 02_线性模型_逻辑回归 03_二分类转多分类的一般实现 04_线性模型_感知机 05_线性模型_最大熵模型 06_优化_拟牛顿法实现(DFP,BFGS) 07_01_svm_硬间隔支持向量机与SMO 07_02_svm_软间隔支持向量机 07_03_svm_核函数与非线性支持向量机 08_代价敏感学习_添加sample_weight支持 09_01_决策树_ID3与C4.5 09_02_决策树_CART 10_01_集成学习_简介 10_02_集成学习_boosting_adaboost_classifier 10_03_集成学习_boosting_adaboost_regressor 10_04_集成学习_boosting_提升树 10_05_集成学习_boosting_gbm_
2022-05-30 09:09:38 11.33MB 机器学习 JupyterNotebook
人脸_面具_检测_CNN 基于计算机视觉和深度学习的OpenCV和Pytorch面罩检测系统 数据集 下载数据集: : 训练 训练ResNet50模型:在train_resnet50.ipynb中,选择data_path(安装数据集的位置)和model_dir(应保存训练后的模型的位置)。执行train_resnet50.ipynb 训练MobileNetV2模型:在train_mobilenetv2.ipynb中,选择data_path(安装数据集的位置)和model_dir(应保存经过训练的模型的位置)。执行train_mobilenetv2.ipynb 测验 打开test.ipynb 在导入中:从model_resnet50导入模型中选择以测试ResNet50模型,从model_mobilenetv2导入模型中选择以测试MobileNetV2模型。 选择一个model_p
2022-05-30 08:56:56 10.68MB JupyterNotebook
1
通过从YELP中获取数据,实现基于内存的CF模型和基于模型的CF模型的简单推荐系统。
2022-05-29 15:15:10 441KB JupyterNotebook
1
ECE219_Winter2021:大规模数据挖掘
2022-05-29 12:25:10 17.78MB JupyterNotebook
1
手势识别 描述 识别俄语字母手势的程序。 Mediapipe框架中的模型用于手掌检测。 手势分类分为两个阶段: 通过预先训练的mobilenetv2模型对手掌的选定区域进行分类 然后使用逻辑回归按关键点对手势进行分类 然后将LR分类器的预测结果以较大的权重进行平均 支持的手势 工作实例 运行说明: 克隆此存储库: git clone https://github.com/manosh7n/gesture_recognition.git cd gesture_recognition 创建虚拟环境: python -m venv env 对于linux: source ./env/bin/activate 对于Windows: .\env\Scripts\activate.bat 安装必要的软件包: python -m pip install -r requirements
2022-05-28 23:47:38 18.24MB JupyterNotebook
1
9番茄病害检测与分类(准确度94%) 番茄是印度饮食中不可分割的一部分,这就是为什么在2020财年印度番茄产量超过2100万吨的原因。 但是,如果番茄田受到恶意疾病的保护,甚至会进一步推高这一数字,这将给农民造成金钱和时间方面的严重损失。 为了解决这个问题,我创建了一个深度学习模型,该模型能够识别健康的番茄植物和9种最有害和流行的番茄病,这些病包括细菌斑,早疫病,晚疫病,叶霉病,棕褐色斑病,蜘蛛螨,目标点,黄叶卷曲病毒和番茄花叶病毒。 使用的图书馆 张量流 凯拉斯 脾气暴躁的 大熊猫 Matplotlib 脾气暴躁的 球状 介绍 我创建了一个深度学习模型,该模型可以有效地识别九种番茄疾病。 该模型以常规图层为核心进行特征提取,并使用密集图层进行分类任务。 对模型进行了10个时期的训练,批次大小为574。用于模型训练的数据集是从Kaggle( )下载的。 数据可视化 健康 九种疾病
2022-05-28 11:03:43 24.1MB JupyterNotebook
1
《神经网络与深度学习》课程练习 书籍信息: 欢迎大家补充练习译文。 环境设定 本次作业需要首先安装anaconda3下载地址 2.0 pytorch> 0.4 锻炼 1.热身练习热身 numpy是Python中对于矩阵处理很实用的工具包,本小节作业主要是熟悉基本的numpy操作。 2.线性回归模型 3.线性模型 支持向量机 Softmax回归Softmax回归 4.前馈神经网络 利用numpy实现全连接神经网络 5.卷积神经网络卷积神经网络(CNN) 利用卷积神经网络,处理MNIST数据集分类问题。 6.循环神经网络 基于循环神经网络的唐诗生成问题 7.注意力机制 使用序列对模型进行建模。 使用注意序列对模型进行排序。 11.高斯混合模型高斯混合模型 12.限制性玻尔兹曼机 使用适当的玻尔兹曼机(Restricted Boltzmann Machine,RBM),对MNIST数据集建模。
2022-05-26 14:39:05 14.82MB JupyterNotebook
1
住房预测 影响未来住宅价格的因素 目标:预测房屋的售价 对于这个项目,我选择研究波士顿房屋价格数据集。 数据库中的每个记录都描述了波士顿的郊区或城镇。 数据来自1970年的波士顿标准大都会统计区(SMSA)。属性定义如下(摘自UCI机器学习存储库1): 数据集:(504r,15col),目标:MEDV(买方房屋价格) 特征 : CRIM:城镇居民人均犯罪率 ZN:25,000平方英尺以上的土地划为住宅用地的比例。 印度:每个城镇的非零售营业面积比例 CHAS:Charles River虚拟变量(如果束缚河流,则为1;否则为0) NOX:一氧化氮浓度(百万分之几) RM:每个住宅的平均房间数 年龄:1940年之前建造的自有住房的比例 DIS:到五个波士顿就业中心的加权距离 RAD:径向公路的可达性指数 税额:每10,000美元的全值财产税率 PTRATIO:各镇师生比例 B:10
2022-05-26 12:19:39 391KB JupyterNotebook
1
糖尿病预测因子 根据世界卫生组织的资料,糖尿病是世界上主要的死亡原因之一。 糖尿病是一种代谢性疾病,其分类为高血糖,可导致心脏,肾脏,胰腺和更多器官的损害。 鉴于胰腺不能产生足够的胰岛素,当身体无法使用产生的胰岛素时,就会发生糖尿病。 根据世卫组织的数据,2016年估计有160万人死于糖尿病。 该笔记本调查了使用基于Python的机器学习和数据科学库的情况,以尝试建立一种能够根据其医疗属性预测某人是否患有糖尿病的机器学习模型。 问题定义 对疾病早期阶段的糖尿病的预测可以导致医生可以使用的更好的治疗方法,这可以借助机器学习和数据分析来实现。 该评估的目的是建立一种机器学习模型,以根据患者的医疗属性预测患者是否患有糖尿病。 由于糖尿病预测变量只有两个输出,因此考虑到它涉及确定样本是否属于一个类别或另一个类别,因此将其视为二进制分类。 数据 我使用的数据来自UCI机器学习存储库中的Pima印度
2022-05-26 11:19:27 189KB JupyterNotebook
1