图数据中频繁模式挖掘算法研究综述.pdf
2022-07-11 14:12:42 447KB 文档资料
对近年来频繁模式的挖掘进行了总结。首先对有代表性的挖掘算法从算法思想、关键技术、算法的优缺点进行了分析概括,此后列举了一些典型频繁模式及关联规则的领域应用。综述内容的选择主要基于某一个研究后续被关注程度,组织过程中力争将相关研究进行归类,以给出其发展概貌。上述工作可以为频繁模式挖掘及关联规则的研究提供有益的参考。
2022-06-04 09:37:27 667KB 论文研究
1
针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁模式完全集难以挖掘的问题,文中提出了IFPmax最大频繁模式挖掘算法,在改进的IFP-tree结构的基础上,利用结点的秩进行预判断,充分利用最大频繁模式的性质对已经存在的结点进行标记,有效避免了节点的冗余遍历,提高了最大频繁模式挖掘算法的效率。实验表明,在不同的基准数据集上文中提出的算法更有效,避免了节点的冗余遍历,使最大频繁模式挖掘算法效率更高。
2022-05-01 21:34:24 659KB 计算机技术与应用
1
用Python实现了FP-Growth频繁模式挖掘,文件中包含完整程序和测试数据。之前我还以为代码量相对较大,最后写完了发现只有一百多行,所以理解起来也相对容易
2022-02-06 02:38:34 2KB 数据挖掘 关联规则 频繁项集
1
频繁模式挖掘的模式数量通常过于巨大,在实际应用中只有少量的频繁模式被使用。Top-k频繁模式挖掘通过排列模式频数限制频繁模式的数量,有效提高了算法效率。提出了TPN(Top-k-Patterns based on Nodesets)算法,该算法使用了节点集的概念,将数据压缩于Poc-tree,通过Top-k-rank表重新计算最小支持度限制生成候选模式的数量。实验通过与ATFP,Top-k-FP-growth算法比较,证明该算法有较好的效率。
2021-12-12 23:30:25 556KB 论文研究
1
简述频繁模式挖掘
2021-11-11 16:13:37 1.07MB 频繁模式
1
基于SQL的不产生候选集的频繁模式挖掘.pdf
2021-09-20 13:03:15 216KB SQL 数据库 数据处理 参考文献
Phrase Analysis 说明: 数据仓库与数据挖掘大作业 2018年春 选用Apriori算法从多角度、多篮子粒度进行挖掘,并在多个数据集实现了多个应用。 运行: #Gutenberg数据集 python Associations.py #DBLP数据集 python task1_active.py #任务1 python task2_group.py #任务2 python task3_topic.py #任务3
2021-06-17 20:57:26 5.83MB mining dblp gutenberg apriori
1
高效的单次频繁模式挖掘--Efficient single-pass frequent pattern mining.pdf
2021-04-04 16:10:01 913KB 关联规则挖掘
1
位置不确定移动时空轨迹频繁模式挖掘
2021-03-18 21:16:04 420KB 研究论文
1