上传者: 38715772
|
上传时间: 2021-03-16 14:07:14
|
文件大小: 924KB
|
文件类型: PDF
以前的大多数顺序模式挖掘算法都花了很长时间处理投影数据库,这会导致大量的时间成本。 本文定义了序列x在其前缀序列y上的前缀序列的概念,并提出了一种基于前缀分析的序列模式挖掘算法PPrefixspan。 根据扫描序列数据库SD,获得所有1个长度的序列模式。 比较顺序模式的数量和最小支持数,如果前者小于后者,则将其直接丢弃,并且只能构建投影数据库中的频繁项。 减少了投影数据库中挖掘顺序模式的执行时间。 提出了一种基于前缀的增量前缀范围算法PIN-Prefixspan来处理动态数据库,利用原始序列数据库的频繁模式挖掘结果来提高更新序列数据库的挖掘效率。 实验结果表明,PIN-Prefixspan的时间成本效率更高。