聚类概念 聚类是把相似的东西分到一组,它是一个无监督问题,没有标签使用 难点: 对于有标签的有监督学习问题,标签可以便于我们来评估模型,无监督学习问题在评估上比较难一点 对于不同的参数组合,得到的学习结果,因为比较难对模型做评估,所以不能通过一个精确度的好坏来选择参数组合 K-MEANS算法 K-MEANS算法是聚类问题中,最简单,也是最实用的一个算法 基本概念 一个数据放进来,需要指定K值,来声明要得到簇的个数 质心:一个簇的数据均值,即向量各维取平均即可(迭代时使用) 距离的度量:常用欧几里得距离和余弦相似度(数据需先标准化) 优化目标 通过目标函数进行不断地优化、求解 min∑i=1K∑
2021-10-23 10:22:29 438KB mean ns 学习
1
本文中将针对树模型的参数进行优化 数据预处理 前面已经做过好几次数据预处理了,这里直接上代码 得到数据 # 导入工具包 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split # 读取数据 features = pd.read_csv('data/temps_extended.csv') # 独热编码处理数据 features = pd.get_dummies(features) # 标签和特征划分 labels = features['actual'] featur
2021-10-17 11:02:04 104KB 参数 学习 机器学习
1
个人黑马机器学习入门笔记
2021-08-21 19:13:35 46.21MB 机器学习 python
1
数据集介绍 总共包含150行数据 每一行数据由 4 个特征值及一个目标值组成。 4 个特征值分别为:萼片长度、萼片宽度、花瓣长度、花瓣宽度 目标值为三种不同类别的鸢尾花,分别为: Iris Setosa、Iris Versicolour、Iris Virginica 数据集中每朵鸢尾花叫做一个数据点,它的品种叫做它的标签 数据集样式: 导入需要的模块包 import numpy as np from matplotlib import colors from sklearn import svm from sklearn import model_selection import mat
2021-08-16 22:40:34 142KB python python机器学习 分类
1
多元逻辑斯蒂回归matlab代码机器学习课程 挑战 了解机器学习的基础。 动作 研究了以下概念: 线性回归:训练集,特征,目标变量,假设,学习算法,参数,成本函数,优化问题,梯度下降,学习率,批次梯度下降 多元线性回归:特征缩放,均值归一化,选择学习率,正态方程 逻辑回归:分类,逻辑函数,S形函数,决策边界,非线性决策边界,成本函数,优化算法,多类分类,一对多 正则化:过度拟合,正则化参数,正则线性回归,正则逻辑回归 神经网络:计算机视觉,S型激活函数,层,偏差,正向传播,非线性分类,反向传播算法,随机初始化 模型选择:训练/验证/测试集,诊断偏差和方差,交叉验证错误,正则化,学习曲线,高偏差,高方差,误差分析,精度,召回率,F1得分 支持向量机:SVM假设,大余量分类器,核,相似度,高斯核,线性核,多项式核, 无监督学习:聚类,K-均值 主成分分析:降维,数据压缩,数据可视化,协方差矩阵sigma,sigma的特征向量,压缩表示的重构,pf主成分数,学习加速 k-均值聚类:聚类索引,聚类质心,随机初始化,肘法 异常检测:密度估计,正态与异常,欺诈检测,制造,监控工作参数,高斯分布,特
2021-08-09 22:25:34 75.16MB 系统开源
1
为什么要做降维: 提高计算效率 留存有用的特征,为后续建模使用 在项目中实际拿到的数据,可能会有几百个维度(特征)的数据集,这样的数据集在建模使用时,非常消耗计算资源,所以需要通过使用降维方法来优化数据集 线性判别分析(Linear Discriminant Analysis) 用途:数据预处理中的降维,分类任务(有监督问题) 目标:LDA关心的是能够最大化类间区分度的坐标轴成分 将特征空间(数据集中的多维样本)投影到一个维度更小的 k 维子空间中,同时保持区分类别的信息 原理:投影到维度更低的空间中,使得投影后的点,会形成按类别区分,一簇一簇的情况,相同类别的点,将会在投影后的空间中更接近
2021-07-07 15:03:37 281KB api ar c
1
机器学习入门与算法总览
2021-06-28 11:07:37 2.82MB 机器学习
1
人工智能
2021-06-09 14:01:38 6.81MB 人工智能 ai 机器学习
1
机器学习入门——MATLAB实战与应用》一书中的实例程序。涉及监督学习,非监督学习和强化学习。(code for book "Machine Learning Introduction & Action in MATLAB")
2021-06-07 17:02:15 384KB 机器学习 matlab machine learning
1
机器学习入门——MATLAB实战与应用》一书中的实例程序。涉及监督学习,非监督学习和强化学习。(code for book "Machine Learning Introduction & Action in MATLAB")
2021-06-07 17:02:15 384KB 机器学习 matlab machine learning
1