上传者: 42113380
|
上传时间: 2022-03-04 20:01:20
|
文件大小: 7KB
|
文件类型: -
火花先验
使用 Spark 的蛮力 Apriori 算法实现。 该算法不继续建立关联规则。
用法
输入最大 minsup 输出分区
spark-submit \
--class "com.jgalilee.spark.apriori.JobDriver" \
--master local[4] \
./target/scala-2.10/spark-apriori_2.10-1.0.jar \
input/transactions.txt \
10 \
3 \
output \
3
input - 输入交易数据的路径。
max - 要运行的最大迭代次数。
minsup - 被视为频繁项集的最小支持度候选项集。
output - 为迭代 n 写入输出的路径 - 即 output/n
partitions - 用于事务数据集的分区数。
假设
输入数据被