在本文中,我们提出了一种算法TKBT(基于TKTT的top-k封闭频繁项集),可有效地挖掘数据流中的top-k封闭频繁项集。 首先根据滑动窗口中数据流的数据连续性和可变性,定义了一种新颖的结构BWT(位向量窗口表)。 在BWT水平方向上,我们使用位向量来表示事务,在最旧,最新的窗口以及当前时间的所有窗口中记录项目数,从而减少了新窗口滑入时项目数的计算时间。在BWT垂直方向上,我们设置了窗口分区,这使得我们只需要在出现新窗口时用相应的最新窗口替换最旧的窗口信息即可。 TKTT(top-k临时表)的构建基于BWT。 TKTT中的项目集按降序排列。 通过使用自上而下的策略将TKTT中的候选人连接起来,TKBT可以获得前k个封闭的频繁项目集。 通过使用封闭项集替换子集来减少候选数,并减少连接时间,从而减少运行时间。 实验结果表明,TKBT非常有效且可扩展。
2021-03-16 14:07:19 1.13MB Data Streams Sliding Window
1
基于Apriori、FP-Growth及Eclat算法的频繁模式挖掘源程序 一、DataMiningApriori程序 用eclipse打开,把三个测试数据mushroom、accidents和T10I4D100K放置 在F:\DataMiningSample\FPmining文件夹下面,即可运行 二、FP-growth程序 1、包括程序源文件和编译生成的可执行原件 2、程序运行方法 把FP_Growth.exe可执行文件与三个测试数据mushroom、accidents 和T10I4D100K放置在同一个文件夹下面,双击FP_Growth.exe,即可 顺序挖掘mushroom、accidents和T10I4D100K事物数据集中的频繁 模式,阈值设定见testfpgrowth.cpp文件中的main函数 三、Eclat程序直接用eclipse打开执行 四、输出的频繁模式及支持度文件示例给出了部分输出文件,由于全部输出文件太大,所有没有全部给出,可以由执行程序得出。另外附带详解PPT
2019-12-21 22:08:44 3.6MB Apriori FP-Growth Eclat 频繁模式挖掘
1
C++实现Apriori算法,频繁模式数据挖掘,最大频繁项集,闭频繁项集,里面包括测试数据以及apriori.cpp、 apriori.h 、apriori_test.cpp三个文件。具体的相见博客:http://blog.csdn.net/FreeApe/article/details/49562315
1