上传者: 42127748
|
上传时间: 2021-10-21 08:23:00
|
文件大小: 23KB
|
文件类型: -
Hadoop先验
使用 Hadoop 的蛮力 Apriori 算法实现。 该算法不继续建立关联规则。
用法
家庭输入输出 minsup 最大数量
hadoop jar HadoopApriori.jar com.jgalilee.hadoop.apriori.driver.Driver \
input/apriori.state \
input/transactions.txt \
output \
3 \
10 \
2
home - 每次迭代都可以写入文件名迭代状态的路径。
input - 输入交易数据的路径。
output - 为迭代 n 写入输出的路径 - 即 output/n
minsup - 被视为频繁项集的最小支持度候选项集。
max - 要运行的最大迭代次数。
number - 向 Hadoop 作业建议的减速器数量。
假设
输入数据被假定