序列模式是给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即该子序列在序列集中的出现频率不低于用户指定的最小支持度阈值
2022-04-19 22:00:51 572KB 序列模式 GSP算法
1
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间。减少计算量、节省存储空间开销成为序列模式挖掘的关键。因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(PrefixofFirstPositiononBitMap)表用于记录序列中的每个项在位图中第1次出现的位置。实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更
2022-03-11 03:16:32 752KB 工程技术 论文
1
基本概念 类Apriori生成候选算法 FreeSpan算法,PrefixSpan算法 相似性搜索 其他
2022-02-05 09:13:51 727KB 数据挖掘 big data 算法
综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念; 其次总结了序列模式挖 掘的一般方法, 介绍并分析了最具代表性的序列模式挖掘算法; 最后展望序列模式挖掘的研究方向。便于研究 者对已有算法进行改进, 提出具有更好性能的新的序列模式挖掘算法。
2021-12-07 16:22:58 189KB 序列挖掘
1
数据挖掘顺序模式 挖掘频繁序列/序列模式的算法实现 实现的算法 [PrefixSpan - 前缀投影模式增长] ( ) [SPAM - 使用位图表示的顺序模式挖掘] ( ) [LAPIN-SPAM - 最后位置归纳序列模式挖掘] ( ) [BIDE - 双向扩展模式闭合检查] ( ) 用于位图操作的优化 [De Bruijn 序列] ( ) [Bit Twiddling Hacks] ( )
2021-10-27 20:31:41 47KB C#
1
序列模式挖掘(AprioriAll和AprioriSome算法)-附件资源
2021-10-04 11:35:21 23B
1
全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据,这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照,蕴含了丰富的信息,这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值,而这些过程通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。
2021-04-09 09:09:15 821KB 时空轨迹 挖掘方法综述
1
以前的大多数顺序模式挖掘算法都花了很长时间处理投影数据库,这会导致大量的时间成本。 本文定义了序列x在其前缀序列y上的前缀序列的概念,并提出了一种基于前缀分析的序列模式挖掘算法PPrefixspan。 根据扫描序列数据库SD,获得所有1个长度的序列模式。 比较顺序模式的数量和最小支持数,如果前者小于后者,则将其直接丢弃,并且只能构建投影数据库中的频繁项。 减少了投影数据库中挖掘顺序模式的执行时间。 提出了一种基于前缀的增量前缀范围算法PIN-Prefixspan来处理动态数据库,利用原始序列数据库的频繁模式挖掘结果来提高更新序列数据库的挖掘效率。 实验结果表明,PIN-Prefixspan的时间成本效率更高。
2021-03-16 14:07:14 924KB Sequential Pattern Mining Prefixspan
1
一般的加权顺序模式挖掘算法会忽略或没有充分利用时间和数据元素的时间间隔信息。 除了某些算法需要扫描数据库外时间或建立临时数据库。 为了解决这些问题,我们提出了一种基于内存的算法MITWCSpan(用于时间间隔加权封闭式顺序模式挖掘的内存索引),用于区间加权封闭顺序模式挖掘。 该算法充分考虑了重要性数据元素的时间间隔。 此外,基于时间间隔p-tidx的改进索引集是定义。 在挖掘过程中,该算法递归采用“查找-然后-索引”技术来查找可以构成时间间隔加权顺序模式并构造p-tidx的项目可能的顺序模式。 最后,算法使用闭合检测得到整个时间间隔加权封闭顺序模式。 实验结果表明,该算法更加有效。 寻找更重要的顺序模式。
2021-03-16 14:07:13 252KB Time-interval Weighted Sequential Patter;
1
本算法为数据挖掘中序列模式挖掘中的GSP算法的基本实现,可依托此算法进行算法的优化操作。
2019-12-21 21:11:22 18KB GSP算法
1