图数据中频繁模式挖掘算法研究综述.pdf
2022-07-11 14:12:42 447KB 文档资料
对近年来频繁模式的挖掘进行了总结。首先对有代表性的挖掘算法从算法思想、关键技术、算法的优缺点进行了分析概括,此后列举了一些典型频繁模式及关联规则的领域应用。综述内容的选择主要基于某一个研究后续被关注程度,组织过程中力争将相关研究进行归类,以给出其发展概貌。上述工作可以为频繁模式挖掘及关联规则的研究提供有益的参考。
2022-06-04 09:37:27 667KB 论文研究
1
分布式存储结构的频繁闭合模式挖掘并行算法.doc
2022-05-30 09:08:38 180KB 文档资料 分布式
安全技术-网络信息-面向复杂网络的结构模式挖掘及传播动力学模型研究.pdf
2022-05-06 09:00:28 7.3MB 文档资料 安全 网络
针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁模式完全集难以挖掘的问题,文中提出了IFPmax最大频繁模式挖掘算法,在改进的IFP-tree结构的基础上,利用结点的秩进行预判断,充分利用最大频繁模式的性质对已经存在的结点进行标记,有效避免了节点的冗余遍历,提高了最大频繁模式挖掘算法的效率。实验表明,在不同的基准数据集上文中提出的算法更有效,避免了节点的冗余遍历,使最大频繁模式挖掘算法效率更高。
2022-05-01 21:34:24 659KB 计算机技术与应用
1
序列模式是给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即该子序列在序列集中的出现频率不低于用户指定的最小支持度阈值
2022-04-19 22:00:51 572KB 序列模式 GSP算法
1
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间。减少计算量、节省存储空间开销成为序列模式挖掘的关键。因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(PrefixofFirstPositiononBitMap)表用于记录序列中的每个项在位图中第1次出现的位置。实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更
2022-03-11 03:16:32 752KB 工程技术 论文
1
用Python实现了FP-Growth频繁模式挖掘,文件中包含完整程序和测试数据。之前我还以为代码量相对较大,最后写完了发现只有一百多行,所以理解起来也相对容易
2022-02-06 02:38:34 2KB 数据挖掘 关联规则 频繁项集
1
基本概念 类Apriori生成候选算法 FreeSpan算法,PrefixSpan算法 相似性搜索 其他
2022-02-05 09:13:51 727KB 数据挖掘 big data 算法
频繁模式挖掘的模式数量通常过于巨大,在实际应用中只有少量的频繁模式被使用。Top-k频繁模式挖掘通过排列模式频数限制频繁模式的数量,有效提高了算法效率。提出了TPN(Top-k-Patterns based on Nodesets)算法,该算法使用了节点集的概念,将数据压缩于Poc-tree,通过Top-k-rank表重新计算最小支持度限制生成候选模式的数量。实验通过与ATFP,Top-k-FP-growth算法比较,证明该算法有较好的效率。
2021-12-12 23:30:25 556KB 论文研究
1