1. 数据加载 假如进行房价的预测,这里加载的数据共1000条,共十个维度(十个特征),除了id以外,其余的都是自变量(9个可用) import pandas as pd import numpy as np import os import matplotlib.pyplot as plt os.chdir(r"C:\Users\86177\Desktop") df = pd.read_csv('sample_data_sets.csv') print(df.columns) print(df.shape) –> 输出的结果为: Index(['id', 'complete_year',
2021-11-01 13:59:52 149KB ar AS c
1
使用机器学习预测天气 使用多项式Lo​​gistic回归,决策树,朴素贝叶斯多项式和支持向量机进行天气预报 资料集 我们的数据集如下所示,是我们从收集的 我们拥有过去30年[1988-2017]的天气数据。训练和测试集分为两个部分,其中两个类别的数据分别占70%和30%。 参数: 天 月 年 湿度(%) 最高温度(单位⁰C) 最低温度(inC) 雨量(毫米) 海平面压力(以MB为单位) 阳光(小时) 风速(结) 云(在okta中) 训练和测试模型的准确性: 模型 训练准确率(%) 测试精度(%) 逻辑回归 74.2 76.9 决策树 76.8 74.05 多项式N
2021-10-26 17:35:08 233KB python scikit-learn pandas logistic-regression
1
发现之前已为我们提供了很棒的ISLR python版本 带有Python的ISLR R(ISLR)中的统计学习简介으Python으로 슬라이드나가자료 1장-简介 인공지능,머신러닝,데이터사이언스,예측분석을... 2장-统计学习 监督学习소개 3장-线性回归 statsmodel패키지사용하여 scikit-learn의OLS估计器사용하여 4장-分类 Logistic回归:scikit-learn estimator统计模型라이브러리사용하여, KNN回归分类:scikit-learn estimator사용하여, 回归指标(评估指标):MAE,MSE,RMSE 分类器평가
1
遗传线性回归:通过遗传算法进行线性回归拟合的近似
1
Zillow预测模型:使用Kaggle数据集的机器学习项目
2021-10-20 19:30:28 2.24MB machine-learning numpy scikit-learn eda
1
pima_prediction 针对皮马印第安人的Scikit-Learn机器学习模型,用于预测患上糖尿病的可能性。 数据来自杰里·库拉塔(Jerry Kurata)的“学位”课程。 我使用数据文件和Jerry的课程来使自己沉浸在机器学习工作流程中。 Jupyter-Notebook遍历了数据处理以及多种模型的训练/评估。 我对注释和代码进行了编辑,以帮助我自己理解。
2021-10-19 23:52:39 58KB JupyterNotebook
1
乳腺癌检测:机器学习算法在威斯康星州诊断数据集上的应用 注意:此存储库已淘汰,不会移植为使用TF2。 但是,您可以以此为参考。 该论文于2018年2月2-4日在越南富国岛举行的第二届机器学习与软计算国际会议(ICMLSC)上发表。 有关该项目的全文,请访问 。 抽象 本文对威斯康星州的六种机器学习(ML)算法进行了比较: ,线性回归,多层感知器(MLP),最近邻(NN)搜索,Softmax回归和支持向量机(SVM)诊断性乳腺癌(WDBC)数据集通过测量其分类测试的准确性以及其敏感性和特异性值。 所述数据集包含特征,这些特征是根据乳腺肿块的FNA测试的数字化图像计算得出的[22]。 为
1
组套索 组套索正则化器是一种在机器学习和统计中实现结构化稀疏性的众所周知的方法。 这个想法是创建协变量的非重叠组,并恢复其中只有这些协变量组的稀疏集合具有非零分量的回归权重。 有几个原因说明为什么这可能是一个好主意。 例如,假设我们有一组传感器,并且这些传感器中的每一个都会生成五个测量值。 我们不想保留不必要的传感器数量。 如果我们尝试正常的LASSO回归,那么我们将获得稀疏分量。 但是,这些稀疏分量可能不对应于一组稀疏传感器,因为它们各自生成五个测量值。 如果我们改为使用LASSO组,并将测量结果按被测量的传感器分组,那么我们将获得一组稀疏的传感器。 组套索正则化器的扩展是稀疏组套索正则化器 ,它强加了按组稀疏性和按系数稀疏性。 这是通过将组套索罚分与传统套索罚分相结合来完成的。 在该库中,我实现了一个完全兼容scikit-learn API的高效稀疏组套索求解器。 关于这个项目
2021-10-15 16:43:44 43KB Python
1
多模式语音情感识别和歧义解决 总览 从语音中识别情感是一项与情感本身含糊不清的定义有关的艰巨任务。 在这项工作中,我们建立了轻量级的多模式机器学习模型,并将其与较重且难以解释的深度学习对应模型进行了比较。 对于这两种类型的模型,我们都使用来自给定音频信号的手工制作的功能。 我们的实验表明,轻量级模型可以与深度学习基准媲美,甚至在某些情况下甚至可以胜过深度学习基准,从而在IEMOCAP数据集上实现了最先进的性能。 获得的手工特征向量用于训练两种类型的模型: 基于ML:逻辑回归,SVM,随机森林,极限梯度增强和多项朴素贝叶斯。 基于DL:多层感知器,LSTM分类器 该项目是滑铁卢大学CS 698-计算音频课程的一个课程项目。 有关详细说明,请查看。 数据集 数据集用于这项工作中的所有实验。 请参阅该,以获取对应用于数据集的预处理步骤的详细说明。 要求 所有实验均使用以下库进行了测试: xgboost == 0.82 火炬== 1.0.1.post2 scikit学习== 0.20.3 numpy == 1.16.2 jupyter == 1.0.0 熊猫== 0.24.1
2021-10-14 18:55:34 1.24MB scikit-learn pandas python3 pytorch
1
Hands On Machine Learning with Scikit Learn and TensorFlow,深度学习入门书籍,高清中文+英文+书签+代码
2021-10-12 10:23:43 34.54MB 深度学习
1