分类关联规则归纳算法及应用研究.pdf
2022-07-11 09:11:01 4.92MB 文档资料
人工智能-机器学习-关联规则分析-Apriori算法实例-挖掘电影导演的关联规则
该数据是Data Castle提供的一组比赛数据,分为两组,分别是训练集和测试集,每一组都包含大约1万名学生的信息纪录。 #数据主要包括: 图书借阅数据borrow_train.txt和borrow_test.txt; 一卡通数据card_train.txt和card_test.txt; 寝室门禁数据dorm_train.txt和dorm_test.txt; 图书馆门禁数据library_train.txt和library_test.txt; 学生成绩数据score_train.txt和score_test.txt; 助学金获奖数据subsidy_train.txt和subsidy_test.txt 目的是根据学生的行为记录数据和助学金数据,探究学生的行为活动(日常生活是否规律,勤奋程度)和成绩之间是否有某种联系。
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPrePost。该算法在PrePost算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进PrePost算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应大数据关联规则挖掘。
1
人工智能-项目实践-关联规则挖掘-本项目使用了 FP-Growth 和 K-Means 两种算法,挖掘了我校图书馆借阅记录中的隐藏信息,并以此为基础开发了相应的图书推荐算法
2022-06-27 13:05:21 18.38MB fp-growth k-means 推荐系统 推荐算法
2018全国高校云计算应用创新大赛 最终排名:1 repo为技能赛的赛题一: 购物篮数据集 记录数 项目数 最短长度 最长长度 平均长度 1,692,082 5,267,656 1 71,472 177 用户数据集 用户数 项目数 最短长度 最长长度 平均长度 330,244 1,080,203 4 1,195 130 采用的频繁项集挖掘算法为PFP-Growth 比赛相关信息点 项目结构   本项目用scala语言编写,用maven组织。代码结构如下。 项目src/main/AR目录下存放源代码文件。 main文件夹中存放频繁项集挖掘与关联规则生成与关联规则匹配与推荐分值计算这两个模块的代码。 util包里FPTree、AssociationRules是频繁项集挖掘所必须的数据结构,FPNewDef是基于mllib的FP-Growth算法的优化版本。 conf文件夹包含一个Conf类用于
1
这是一个关于数据挖掘中关联规则之Aprior算法的实现。这是从网上找到的一个别人写好的程序,本人只是对这个程序进行了轻微的修改;本人忘记了这个程序是由谁写的,所以如果您发现这个程序的原创作者,可以联系本人,本人深表谢意。
2022-06-10 09:53:52 772KB 数据挖掘关联规则Aprior算法
1
关联规则挖掘算法探究论文.pdf
2022-06-04 18:01:36 558KB 算法 文档资料 资料
铝电解控制中灰关联规则挖掘算法的应用.doc
2022-05-31 09:10:01 702KB 算法 文档资料
关联规则中Apriori算法的C#实现研究.txt
2022-05-26 09:10:41 5KB 文档资料