大数据之数据分析.pptx

上传者: 43934844 | 上传时间: 2022-06-21 17:05:29 | 文件大小: 5.59MB | 文件类型: PPTX
数据分析 郭现伟 大数据之数据分析全文共11页,当前为第1页。 数据分析知识点 大数据之数据分析全文共11页,当前为第2页。 监督学习和非监督学习 监督学习 监督学习针对有标签数据集,它通过学习出一个模型(其实就是一个函数)来拟合数据,按照模型(函数)的输出结果是否离散又可以分为两类,分别是:(1)输出结果为离散值,则为分类问题(常见的分类算法:KNN、贝叶斯分类器、决策树、SVM、神经网络、GBDT、随机森林等);(2)输出结果为连续值,则为回归问题(有线性回归和逻辑回归两种)。 无监督学习 无监督学习针对没有标签的数据集,它将样本按照距离划分成类簇,使得类内相似性最大,类间相似性最小。通过观察聚类结果,我们可以得到数据集的分布情况,为进一步分析提供支撑。常见的聚类算法有K-means、高斯混合模型和LDA。 如何选择有监督和无监督? 1、是否有标签和训练数据 2、数据条件是否可改善 3、看样本是否独立分布 大数据之数据分析全文共11页,当前为第3页。 数据分析常用算法 大数据之数据分析全文共11页,当前为第4页。 数据分析算法 回归算法 回归分析是一种预测性的建模技术。 它研究的是

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明