【主要内容】 序列模式简介 GSP算法 PrefixSpan算法
2022-02-05 09:13:50 553KB 数据挖掘 算法 big data
使用约束的必要性 在数据挖掘中常使用的几种约束: 知识类型约束:指定要挖掘的知识类型 如关联规则 数据约束: 指定与任务相关的数据集 Find product pairs sold together in Vancouver in Dec.’98. 维/层次约束:指定所用的维或概念结构中的层 in relevance to region, price, brand, customer category. 规则约束:指定要挖掘的规则形式(如规则模板) 单价 (price $200). 兴趣度约束:指定规则兴趣度阈值或统计度量 如 (min_support ? 3%, min_confidence ? 60%).
2022-02-05 09:13:50 292KB 数据挖掘 big data 算法
分类数据挖掘算法在开发区经济决策方面的应用.pdf
2022-01-01 12:01:30 73KB 分类算法 数据结构 算法 参考文献
基于matlab的表情识别代码数据挖掘 项目1 在本作业中,您将研究k最近邻,神经网络和SVM分类器在两个实际分类问题上的应用。 用于此分配的数据集已上传到“数据集”文件夹下。 x_train,y_train,x_test和y_test分别表示训练功能,训练标签,测试功能和测试标签。 在x_train和x_test中,每一行代表一个数据样本,每一列代表一个特征。 问题1 人类活动识别数据集是根据对30名志愿者进行的实验而创建的,以使用智能手机数据识别人类活动。 每个人都在腰部佩戴智能手机(三星Galaxy S II)进行六项活动(步行,步行,上楼,下坐,坐着,站立,躺着)。 使用其嵌入式加速度计和陀螺仪,可以以50Hz的恒定速率捕获3轴线性加速度和3轴角速度。 使用信号处理算法处理数据以提取维度561的特征向量。训练集包含7,352个样本,测试集包含2,947个样本。 在此数据集上实现k = 5的k最近邻算法。 使用简单的欧几里德距离度量来计算两个样本之间的距离。 在训练集上训练带有参数2的多项式内核的SVM分类器,并在测试集上进行测试。 您需要为每个课程训练一个SVM。 为了预测测试
2021-12-29 15:56:20 34.77MB 系统开源
1
有关数据挖掘方面的各类算法,以及算法的改进方法和具体实例的核心算法程序。
2021-12-22 12:34:44 7.07MB 数据挖掘
1
这是一个关于数据挖掘方面算法的压缩包,里面全是算法的精华
2021-12-22 12:12:59 7.92MB 数据挖掘
1
数据挖掘技术在当今需要存储、处理、计算大量数据与信息的社会中有非常重要的作用。数据挖掘出现之前,海量的数据只是被简单的存储,不能对隐含在其中的信息进行分析、利用与创造价值,数据挖掘由此出现。数据挖掘是新兴且前沿的技术,是信息领域和数据库领域热点之一。数据挖掘技术的快速发展,出现了适合各领域需求各异的多种不同的分析方法与算法。算法是分析方法的具体实现,首先详细介绍了基于关联规则分析的Apriori算法、FP-growth 算法和Eclat算法,并通过对比这些算法在不同数据集的运行结果,分析了算法各自的优缺点及其适用领域,同时探讨了各个算法的优势互补、有机结合以弥补单独算法不足的可能性。
2021-12-16 17:03:56 33.03MB 算法 毕业设计
之前收集到的一份蛮好的算法资料,适合入门。暂时没有找到最新的,大家有的话麻烦给我分享一下呀!!!对十大算法有基本的认识,并结合python sklearn做了简单应用,最后还有几个分析案例,可以多多学习,不过只能说适合新手入门吧
2021-12-10 14:55:43 4.31MB 数据挖掘 算法 python
1
Java算法大全(近100种算法打包)+ 常见的数据挖掘算法源代码集中打包 内容: 1、java语言常用算法大全,有近100多种常见算法的源代码。 2、各种常用数据挖掘算法的详细教学材料和配套源代码,大概包含了神经网络算法,Karuna Pande Joshi算法,K-Means动态聚类算法,聚类算法等常用算法。从理论到实践,手把手指引您对数据挖掘从起步走向精通。
2021-12-08 10:07:02 2.61MB Java算法 数据挖掘算法 算法打包 Java
1
第六章 朴素贝叶斯分类 6.1 朴素贝叶斯分类数学基础 1.贝叶斯定理 假设对于某个数据集,随机变量 C 表示样本为 C 类的概率,F1 表示测试样本某特征出现的概率,套 用基本贝叶斯公式,则如下所示: 上式表示对于某个样本,特征 F1 出现时,该样本被分为 C 类的条件概率。 对于该公式,需要熟知的概念: 先验概率(Prior):P(C)是 C 的先验概率,可以从已有的训练集中计算分为 C 类的样本占所有样本的 比重得出。 证据(Evidence):即上式 P(F1),表示对于某测试样本,特征 F1 出现的概率。同样可以从训练集中 F1 特征对应样本所占总样本的比例得出。 似然(likelihood):即上式 P(F1|C),表示如果知道一个样本分为 C 类,那么他的特征为 F1 的概率是 多少 对于多特征而言: 贝叶斯定理是基于假设的先验概率给定假设下观察到不同数据的概率,提供了一种计算后验概率的方 法 6.2 朴素贝叶斯分类 1.思想基础 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项 属于哪个类别。 2.假设条件 1)特征之间相互独立 2)每个特征同等重要 3.朴素的概念
2021-12-04 13:24:12 4.91MB 数据挖掘算法 Python
1