位置不确定移动时空轨迹频繁模式挖掘
2021-03-18 21:16:04 420KB 研究论文
1
在本文中,我们提出了一种算法TKBT(基于TKTT的top-k封闭频繁项集),可有效地挖掘数据流中的top-k封闭频繁项集。 首先根据滑动窗口中数据流的数据连续性和可变性,定义了一种新颖的结构BWT(位向量窗口表)。 在BWT水平方向上,我们使用位向量来表示事务,在最旧,最新的窗口以及当前时间的所有窗口中记录项目数,从而减少了新窗口滑入时项目数的计算时间。在BWT垂直方向上,我们设置了窗口分区,这使得我们只需要在出现新窗口时用相应的最新窗口替换最旧的窗口信息即可。 TKTT(top-k临时表)的构建基于BWT。 TKTT中的项目集按降序排列。 通过使用自上而下的策略将TKTT中的候选人连接起来,TKBT可以获得前k个封闭的频繁项目集。 通过使用封闭项集替换子集来减少候选数,并减少连接时间,从而减少运行时间。 实验结果表明,TKBT非常有效且可扩展。
2021-03-16 14:07:19 1.13MB Data Streams Sliding Window
1
以前的大多数顺序模式挖掘算法都花了很长时间处理投影数据库,这会导致大量的时间成本。 本文定义了序列x在其前缀序列y上的前缀序列的概念,并提出了一种基于前缀分析的序列模式挖掘算法PPrefixspan。 根据扫描序列数据库SD,获得所有1个长度的序列模式。 比较顺序模式的数量和最小支持数,如果前者小于后者,则将其直接丢弃,并且只能构建投影数据库中的频繁项。 减少了投影数据库中挖掘顺序模式的执行时间。 提出了一种基于前缀的增量前缀范围算法PIN-Prefixspan来处理动态数据库,利用原始序列数据库的频繁模式挖掘结果来提高更新序列数据库的挖掘效率。 实验结果表明,PIN-Prefixspan的时间成本效率更高。
2021-03-16 14:07:14 924KB Sequential Pattern Mining Prefixspan
1
一般的加权顺序模式挖掘算法会忽略或没有充分利用时间和数据元素的时间间隔信息。 除了某些算法需要扫描数据库外时间或建立临时数据库。 为了解决这些问题,我们提出了一种基于内存的算法MITWCSpan(用于时间间隔加权封闭式顺序模式挖掘的内存索引),用于区间加权封闭顺序模式挖掘。 该算法充分考虑了重要性数据元素的时间间隔。 此外,基于时间间隔p-tidx的改进索引集是定义。 在挖掘过程中,该算法递归采用“查找-然后-索引”技术来查找可以构成时间间隔加权顺序模式并构造p-tidx的项目可能的顺序模式。 最后,算法使用闭合检测得到整个时间间隔加权封闭顺序模式。 实验结果表明,该算法更加有效。 寻找更重要的顺序模式。
2021-03-16 14:07:13 252KB Time-interval Weighted Sequential Patter;
1
面向移动时空轨迹数据的频繁闭合模式挖掘
2021-03-12 18:05:32 422KB 研究论文
1
随机采样移动轨迹时空热点区域发现及模式挖掘
2021-03-12 18:05:31 1.1MB 研究论文
1
作者:王丽珍,陈红梅 编著 出版社:科学出版社 出版时间:2014年07月 空间关联和并置模式被统称为空间模式,空间模式发现是空间数据挖掘中最重要的任务之一。本书围绕挖掘的目标(如关联或并置)和对象(如经典数据、区间数据、不确定性数据或模糊数据等),系统地介绍了作者在空间模式挖掘领域的主要研究成果。内容包括:绪论;空间模式挖掘基础;空间关联规则挖掘;经典数据的空间co?location模式挖掘(1)、(2);不确定性数据的空间co?location模式挖掘;区间数据的空间co?location模式挖掘;模糊数据的空间co?location模式挖掘;加权co?location模式及其挖掘算法;负co?location模式挖掘及SCPMiner开发等。?本书可供高等院校计算机及相关专业的本科生、研究生参考,对从事计算机开发及应用的科技人员及开发人员也有较大的参考价值。
2021-02-21 09:17:40 71.83MB 挖掘理论
1
基于Apriori、FP-Growth及Eclat算法的频繁模式挖掘源程序 一、DataMiningApriori程序 用eclipse打开,把三个测试数据mushroom、accidents和T10I4D100K放置 在F:\DataMiningSample\FPmining文件夹下面,即可运行 二、FP-growth程序 1、包括程序源文件和编译生成的可执行原件 2、程序运行方法 把FP_Growth.exe可执行文件与三个测试数据mushroom、accidents 和T10I4D100K放置在同一个文件夹下面,双击FP_Growth.exe,即可 顺序挖掘mushroom、accidents和T10I4D100K事物数据集中的频繁 模式,阈值设定见testfpgrowth.cpp文件中的main函数 三、Eclat程序直接用eclipse打开执行 四、输出的频繁模式及支持度文件示例给出了部分输出文件,由于全部输出文件太大,所有没有全部给出,可以由执行程序得出。另外附带详解PPT
2019-12-21 22:08:44 3.6MB Apriori FP-Growth Eclat 频繁模式挖掘
1
本算法为数据挖掘中序列模式挖掘中的GSP算法的基本实现,可依托此算法进行算法的优化操作。
2019-12-21 21:11:22 18KB GSP算法
1
这是我的《数据挖掘-概念与技术(第三版)》读书笔记,脑图格式,里面有核心概念和本书的基本逻辑框架,适合于初学者、想要体系化知识框架的从业者。 本文件不署名,也可随意分发、修改。
2019-12-21 20:06:57 3.32MB 数据挖掘 聚类 模式挖掘
1