贝叶斯分类是统计学方法。他们可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。贝叶斯分类主要是基于贝叶斯定理,通过计算给定样本属于一个特定类的概率来对给定样本进行分类。
2021-08-07 12:06:11 871KB 机器学习 朴素贝叶斯
支持向量机(Support Vector Machine,简称SVM )是由贝尔实验室研究者Vapnik等于1995年首先提出的一种新的机器学习理论。 SVM主要思想是针对两类分类问题,在高维空间中寻找一个超平面作为两类的分割,以保证最小的分类错误率。 SVM一个重要的优点是可以处理线性不可分的情况,在解决小样本、非线性及高维(避免维灾难)模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 SVM独特的特点:使用训练集的一个子集来表示决策边界,该子集称作支持向量。
2021-08-07 12:06:10 1.74MB 支持向量机
分类是数据挖掘的基本功能之一。 分类问题是一个普遍存在的问题,有许多不同的应用: 根据Email的标题和内容过滤垃圾邮件 根据核磁共振扫描的结果区分肿瘤是良性或恶性 信用分级、市场调查、图像模式识别… …
2021-08-06 12:16:39 914KB 分类 机器学习 数据挖掘
本压缩包内含有三个文件:pdf电子书,课程ppt幻灯片,及本书所用的数据库。 本书共分为 8 章和 1 个附录。第 1 章介绍企业数据资源管理,旨在说明数据仓库与数 据挖掘是企业数据资源管理的高级阶段,也是必然趋势。同时也介绍了数据仓库与数据挖 掘能为企业做什么。第 2 章介绍数据仓库的概念与结构,读者在学完本章后可以明白什么 是数据仓库,数据仓库是怎样构成的。第 3 章介绍数据仓库的设计与开发,在学完本章后, 读者可以根据需求设计自己的数据仓库,并逐步地建立自己的数据仓库(或数据集市)。第 4 数据仓库与 数据挖掘 章介绍数据仓库的一个重要应用——联机分析处理,读者可以理解多维数据分析的方法。 第 5 章介绍数据挖掘概述,在学完本章后,读者应能明白数据挖掘能做什么,有些什么方 法。第 6 章介绍数据挖掘中的一个重要的也是工作量最大的一个环节——数据预处理,在 学完本章后,读者应明白为什么要进行预处理,预处理的各种方法,并学会怎样进行数据 的预处理。第 7 章介绍数据挖掘中的常用算法,读者可以理解这些算法的基本思想,掌握 典型算法的应用。第 8 章结合一个实际案例介绍 SQL Server 2005 数据仓库与数据挖掘工具 及其应用。建议读者在本章学习的基础上,自己深入钻研 SQL Server 2005 的数据仓库与数 据挖掘工具。最后,以附录 A 的形式给出了一个简易的数据挖掘工具——Weka,旨在为本 课程的教学提供一个方便的实验环境。
1
数据仓库 数据挖掘 医院信息系统 论文 写论文的朋友们可以下去看看
1
数据挖掘语言方面的论文与文献 以及相关的PPT!!!可以作为相关课程的讨论与交流
2021-06-21 17:58:23 2.7MB 数据挖掘语言 数据区分于汇总
1
Phrase Analysis 说明: 数据仓库与数据挖掘大作业 2018年春 选用Apriori算法从多角度、多篮子粒度进行挖掘,并在多个数据集实现了多个应用。 运行: #Gutenberg数据集 python Associations.py #DBLP数据集 python task1_active.py #任务1 python task2_group.py #任务2 python task3_topic.py #任务3
2021-06-17 20:57:26 5.83MB mining dblp gutenberg apriori
1
1、NumPy的数组创建及随机数生成。2、NumPy中用于统计分析的基本运算函数。3、矩阵创建方法。4、数组索引的方法。5、pyplot基础语法。6、子图的绘制方法。7、散点图、折线图的绘制方法。8、直方图绘制方法。9、饼图绘制。10、箱线图绘制。
2021-06-15 14:06:10 176KB 数据仓库与数据挖掘 python
1
数据仓库与数据挖掘技术在图书馆文献保障体系中的应用,刘鹏,张为杰,高校图书馆在教学和知识传播过程中发挥着巨大作用,为了更好地对图书馆书目、借阅信息以及学生课程信息进行挖掘分析,从而更好的
2021-06-15 11:43:05 285KB 计算机应用
1
讨论了数据仓库的构建方法和数据挖掘技术的应用,介绍了使用分析服务器构建数据仓库及进行联机分析的方法,实现了一个利用决策树算法建立模型对顾客的信誉度进行分类的实例。
1