什么是频繁模式分析?
频繁模式是频繁的出现在数据集中的模式
如项集、子序或者子结构
动机:发现数据中蕴含的内在规律
那些产品经常被一起购买?---啤酒和尿布?
买了PC之后接着都会买些什么?
哪种DNA对这种新药敏感
我们能够自动的分类WEB文档吗?
应用
购物篮分析、WEB日志(点击流)分析、捆绑销售、DNA序列分析等
频繁模式挖掘的重要性
揭示数据集的内在的、重要的特性
作为很多重要数据挖掘任务的基础
关联、相关和因果分析
序列、结构(e.g.子图)模式分析
时空、多媒体、时序和流数据中的模式分析
分类:关联分类
聚类分析:基于频繁模式的聚类
数据仓库:冰山方体计算