实验描述:
对指定数据集进行关联规则挖掘,选择适当的挖掘算法,编写程序实现,提交程序和结果报告。
数据集: retail.txt ,根据数据集中的数据利用合适的挖掘算法得到频繁项集,并计算置信度,求出满足置信度的所有的关联规则
retail.txt中每个数字表示一种商品的ID,一个{}内的表示一次交易
实验环境和编程语言:
本实验使用的编程语言为:Java
编程环境为:Intellij idea
实现频繁项集的挖掘算法为Apriori算法
用于挖掘的样本个数为:1000个(retail.txt的前1000条数据)
样本示例:
{ 38,39,47,48}
表示一个顾客购买了ID为38、39、47、48的四种商品。
1