该数据接近了两所葡萄牙学校的中学学生的学习成绩。 数据属性包括学生成绩,人口统计学,社会和学校相关特征),并通过使用学校报告和调查表进行收集。 提供了两个有关两个不同学科表现的数据集:数学(mat)和葡萄牙语(por)。 在[Cortez and Silva,2008]中,两个数据集是在二进制/五级分类和回归任务下建模的。 重要说明:目标属性G3与属性G2和G1具有很强的相关性。 发生这种情况是因为G3是最后的年级(在第3期发布),而G1和G2分别对应第1和第2期年级。 没有G2和G1的情况下预测G3更加困难,但是这种预测更为有用(有关更多详细信息,请参见纸本资料)。 从该数据集中,只有student_mat被带K-fold交叉验证,一个不带。
2023-10-29 12:45:38 168KB JupyterNotebook
1
实用的时间序列分析 这是出版的《 的代码库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 时间序列分析使我们能够分析一段时间内的某些数据并了解数据随时间变化的模式,这本书将使您了解时间序列分析背后的逻辑并将其应用于各个领域,包括财务,业务和社交媒体。 说明和导航 所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。 该代码将如下所示: import os import pandas as pd %matplotlib inline from matplotlib import pyplot as plt import seaborn as sns 您将需要Anaconda Python发行版来运行本书中的示例,并编写自己的Python程序以进行时间序列分析。 可从免费下载。 本书的代码示例是使用Jupyter Noteb
2023-10-05 22:27:33 2.94MB JupyterNotebook
1
wav2vec2-finetune 尼泊尔文: : 旁遮普语: :
2023-09-26 14:55:40 977KB JupyterNotebook
1
对象检测DETR
2023-09-23 09:29:37 520KB JupyterNotebook
1
Deeplearning.AI_Tensorflow_Developer__Professional_Certificate 该存储库包含来自Coursera的Deeplearning.AI Tensorflow开发人员专业证书课程的完整作业和测验
2023-09-12 00:00:54 1.86MB JupyterNotebook
1
图像相似度 使用Resnet50+KNN在数据集中查找相似图像以获取新图像。 为了解决curse of dimensionality使用PCA来降低特征的维数。 Resnet50(在imageNet上训练) 在没有toplayer的情况下从keras创建Resnet50,以获取卷积特征(2048维)作为输出,而不是图像分类概率。 为数据集的每个图像提取卷积特征(Feature_size:[number_images,2048])。 KNN(不是分类问题) 将最近邻算法拟合到从数据集中提取的特征 提取测试图像(新)的卷积特征,并计算测试图像与数据集的每个图像之间的距离(image_Similarity)。 PCA 将PCA应用于提取的特征并减小尺寸。 使最近邻算法适合新功能
2023-08-30 14:42:39 11.3MB knn resnet-50 imagesimilarity JupyterNotebook
1
预测二氧化碳排放量 目录 关于 预测汽车的CO2排放对于在汽车模型中产生较少的CO2很有用,它将减少二氧化碳在环境中的有害影响。 在该项目中,对数据集进行feature engineering以选择影响车辆二氧化碳排放的特征。 splitting数据按scaling并将其splitting为训练和测试数据集后, splitting进行cross validation 。 在分析learning curve ,然后使用训练数据训练模型。 最后,该模型是对测试数据进行测试,并evaluated的基础上, mean squared error和r2 score 。 使用的技术 用作编程语言。 Numpy用于数学和数据处理。 Pandas用于分析和处理数据。 Matplotlib和Seaborn用于数据可视化,有助于数据分析。 Sciki-learn用于数据预处理,创建机器学习模型并
1
easytorch 使用Python的numpy实现的简易深度学习框架,API与pytorch基本相同,实现了自动求导、基础优化器、layer等。 1 文档目录 2 Quick Start from easytorch.layer import Linear, Tanh, Sequential from easytorch.optim import SGD import easytorch.functional as F # Create a model, optimizer, loss function model = Sequential( Linear(1, 5), Tanh(), Linear(5, 1) ) opt = SGD(model.parameters(), lr=3e-4) loss_fn = F.mse_loss # train the mod
2023-05-15 20:47:00 35KB deep-learning autograd autodiff JupyterNotebook
1
自动化数据科学 这个django专案有多个应用程式: regml-回归问题 classml-分类问题 clustml-聚类问题 superml-深度学习问题 该Web应用程序的最终目标是能够分析提供的数据集并从最常用的模型中推荐最佳的ML模型。 这全都取决于您的机器学习问题。 该工具将执行所需的任何数据预处理-数据清理,特征提取,规范化等。它将可视化数据并查看特征之间的关系。 最终用户只需输入很少的内容,就可以分别处理数字,分类和日期时间功能。 这听起来不令人兴奋吗? REGML-回归ML 该应用程序旨在帮助数据科学家分析回归数据集并推荐最佳ML模型。 数据应以csv / txt格式提供,并且列数或其格式没有限制。 它接受数字,类别或数据列类型。 Please note that the quality of the analysis is as good as the data
2023-05-15 20:39:27 3.61MB JupyterNotebook
1
预测性设备故障
2023-05-09 14:39:37 5.2MB JupyterNotebook
1