支持向量机(Support Vector Machine,简称SVM )是由贝尔实验室研究者Vapnik等于1995年首先提出的一种新的机器学习理论。 SVM主要思想是针对两类分类问题,在高维空间中寻找一个超平面作为两类的分割,以保证最小的分类错误率。 SVM一个重要的优点是可以处理线性不可分的情况,在解决小样本、非线性及高维(避免维灾难)模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 SVM独特的特点:使用训练集的一个子集来表示决策边界,该子集称作支持向量。
2021-08-07 12:06:10 1.74MB 支持向量机
对数仓建设建设的初步思考
2021-08-07 09:05:45 14KB 数据仓库 数仓建设 数仓 建模
1
基于 TiDB 与 Flink 的实时数仓最佳实践的白皮书.pdf
2021-08-06 13:00:55 5.14MB 数据仓库
分类是数据挖掘的基本功能之一。 分类问题是一个普遍存在的问题,有许多不同的应用: 根据Email的标题和内容过滤垃圾邮件 根据核磁共振扫描的结果区分肿瘤是良性或恶性 信用分级、市场调查、图像模式识别… …
2021-08-06 12:16:39 914KB 分类 机器学习 数据挖掘
数据仓库(building the data warehouse)中文版,带目录,一个文件。
2021-08-05 11:01:50 8.71MB 数据仓库 大数据
1
行业分类-物理装置-基于智慧城市数据仓库和识别规则库的套牌车识别方法.zip
KNN专用大数据集,这个数据集包含569例细胞活检案例,每个案例有32个乳房肿块活检图像显示的细胞核的特征。第一个特征是ID,第二个是这个案例的癌症诊断结果,癌症诊断结果用编码"M"表示恶性,B表示良性。其他30个特征是数值型的其他指标,包括细胞核的半径(Radius)、质地(Texture)、周长(Perimeter)、面积(Area)和光滑度(Smoothness)等的`均值、标准差和最大值。
2021-08-04 16:14:02 122KB knn数据集
1
随着The Data Warehouse Toolkit(1996)第1版的出版发行,Ralph Kimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和最佳实践的权威资源。 这本《数据仓库工具箱(第3版)——维度建模权威指南》汇集了到目前为止最全面的维度建模技术。本书采用新的思路和最佳实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 《数据仓库工具箱(第3版)——维度建模权威指南》涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述
2021-08-04 09:39:11 100.08MB 数据仓库
1
如何进行数据仓库建设详细介绍.docx
2021-08-03 09:40:44 227KB 数据仓库
Hive原理、语法笔记简介(还有案例帮助记忆),可以当作字典查询
2021-08-03 09:36:55 2.34MB Hive 数据库 数据仓库 hadoop
1