选择Apriori算法
2021-10-26 09:54:05 14.29MB WEKA 数据挖掘 机器学习
1
关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。(啤酒与尿布) 基本概念 1、支持度的定义:support(X–>Y) = |X交Y|/N=集合X与集合Y中的项在一条记录中同时出现的次数/数据记录的个数。例如:support({啤酒}–>{尿布}) = 啤酒和尿布同时出现的次数/数据记录数 = 3/5=60%。 2、自信度的定义:confidence(X–>Y) = |X交Y|/|X| = 集合X与集合Y中的项在一条记录中同时出现的次数/集合X出现的个数 。例如:co
2021-10-22 21:53:08 148KB apriori io location
1
Hadoop先验 使用 Hadoop 的蛮力 Apriori 算法实现。 该算法不继续建立关联规则。 用法 家庭输入输出 minsup 最大数量 hadoop jar HadoopApriori.jar com.jgalilee.hadoop.apriori.driver.Driver \ input/apriori.state \ input/transactions.txt \ output \ 3 \ 10 \ 2 home - 每次迭代都可以写入文件名迭代状态的路径。 input - 输入交易数据的路径。 output - 为迭代 n 写入输出的路径 - 即 output/n minsup - 被视为频繁项集的最小支持度候选项集。 max - 要运行的最大迭代次数。 number - 向 Hadoop 作业建议的减速器数量。 假设 输入数据被假定
2021-10-21 08:23:00 23KB Java
1
Apriori 算法是著名的关联规则算法. 该C++代码可设置支持度,完成频繁项集的生成.
2021-10-20 20:49:40 84KB Apriori C++
1
为解决传统数据挖掘算法在大量数据处理时面临的内存占用、计算性能等方面的问题,基于Hadoop平台,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,实现Apriori经典数据挖掘算法。通过对已实现的Apriori算法进行优化,引入FIS-IS算法思想,从数据库扫描次数和容量消减方向进行改进。提出针对数据本身进行频繁预选项生成方法与对于频繁预选项剪枝步骤进行分组检索的优化方法。实验结果验证了改进算法对算法运行具有良好的优化效果。
2021-10-20 10:57:54 1.65MB hadoop
1
先验算法 分析购物趋势是数据科学中的一项重大任务,而购物篮分析是完成这一过程的一种方式。 该子领域中的技术试图了解购买某些商品如何影响其他商品的购买。 这使零售商可以通过向上销售或交叉销售现有客户来增加收入。 简短的故事或故事总是可以帮助我们更好地理解概念,但这是一个真实的故事,沃尔玛的啤酒尿布寓言。 沃尔玛的一位销售人员试图通过将产品捆绑在一起并提供折扣来增加商店的销售额。 他将面包和果酱捆在一起,这使客户可以轻松地将它们一起找到。 此外,由于折扣,客户可以一起购买它们。 为了找到更多机会和更多可以捆绑在一起的此类产品,销售人员分析了所有销售记录。 两种产品显然无关,因此他决定更深入地研究。 他发现抚养孩子很痛苦。 为了缓解压力,父母不慎决定购买啤酒。 他将尿布和啤酒配对,销售量上升。 这是数据挖掘中关联规则的完美示例。 关联规则 关联规则是“ if-then”语句,有助于显示各种类
2021-10-18 16:34:04 229KB
1
该实验是本人花了一个下午写的,比较辛苦。
2021-10-16 17:04:25 21KB Apriori 算法实现
1
关联规则Apriori算法实验,内内含代码和。word报告,包您满意。关联规则Apriori算法实验,内内含代码和。word报告,包您满意。关联规则Apriori算法实验,内内含代码和。word报告,包您满意。关联规则Apriori算法实验,内内含代码和。word报告,包您满意。
2021-10-15 13:24:07 131KB apriori 关联规则
1
Apriori源代码,包含c++/java实现;神经网络算法源程序,如SOM、HOPFIELD、CPN、BPN、BOLTZMAN、ART、ADALINE,同时提供针对不同算法的演示源程序;遗传C源代码;外加充实的数据挖掘的算法讲解ppt
2021-10-12 15:33:43 5.06MB 聚类,遗传算法,Apriori
1
Apriori算法最新研究进展,共104页。
2021-10-09 20:06:55 7.38MB Apriori