上传者: 38553681
|
上传时间: 2021-10-06 09:32:23
|
文件大小: 312KB
|
文件类型: -
在事务数据库中搜索频繁模式被认为是最重要的数据挖掘问题之一,而Apriori是用于此任务的典型算法之一。 由于数据库庞大,开发能够处理大量数据的快速高效算法就成为一项艰巨的任务。 在本文中,我们实现了一个基于MapReduce的并行Apriori算法,该算法是一个使用大量计算机(节点)处理某些类型的可分配问题的大型数据集的框架。 实验结果表明,该算法能够很好地扩展和高效地处理商品硬件上的大型数据集。