常用数据挖掘算法总结及Python实现.pdf
2021-08-28 12:01:50 6.01MB Python
常用数据挖掘算法总结及python实现
2021-08-22 13:12:49 37.27MB 常用数据挖掘算法总结及pytho
常用数据挖掘算法总结及Python实现.pdf
2021-08-16 22:11:54 4.63MB Python 常用数据挖掘算法
#Something about the data mining 数据挖掘(Data mining):是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器 学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 数据分析十大经典算法: 1.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。 2.C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是 ID3 算法。 3. Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes) 4. K-means 算法:是一种聚类算法 5. SVM:一种监督式学习方法,广泛应用于统计分类以及回归分析中 6.CART:分类与回归树,下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝 7. KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。 8. Pagerank:是 google 算法的重要内容。 9. adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器集合起来,构成一个更强的最终分类器。 10. EM:最大期望值法。 注意:十大算法大概分类: KNN,决策树(以 C4.5)为例,SVM,AdaBoost,CART,Naive Bayes 都是分类作为目的的算法 而 K-means 是最常见的聚类算法;Apiori 是关联规则挖掘算法;EM 是一种概率模型参数的算 法;PageRank 是一种链接分析的算法,主要用于图数据里,对结点重要性进行排名.
2021-08-12 09:16:12 736KB 资源达人分享计划 数据挖掘 R语言 KDD
使用Python对论文Integrating Classification and Association Rule Mining进行了复现,可供课程大作业、毕业设计等参考。#资源达人分享计划#
2021-08-05 09:14:06 925KB 数据挖掘 Python 作业习题 毕业设计
1
数据挖掘 一些数据挖掘算法的实现
2021-07-14 13:04:07 6KB Java
1
云计算环境下的数据挖掘算法研究.pdf
2021-07-14 11:04:55 1.19MB 数据挖掘 行业数据 数据分析 参考文献
数据挖掘算法在河口羽状流数据分析中的应用.pdf
2021-07-14 11:04:50 1.34MB 数据挖掘 行业数据 数据分析 参考文献
数据挖掘算法与clementine实践数据,共7个章节 3.crx.xls、NewsChan.xls 4.饮料.xls 5.sequence.xls 6.customer_dbase.sav,grantfraudN.db 7.线性回归样本.xls 8.经济发展基本信息.xls,饮料.xls 9.国家外汇储备规模.xls
2021-07-11 16:07:50 1.16MB 数据挖掘 clementine 源数据 实验数据
BankBalance.sav BASKETS.txt Brand.sav BuyOrNot.sav Customer.xls DRUG.txt ExportApple.sav K-Means.sav MBA.sav pptPlex.msi Purchase.xls ReportCard.xls Sequence.sav Students.xls Telephone.sav WebData.mdb ZipCode.txt 关联规则.str 决策树.str 变量管理.str 基本分析.str 样本管理.str 神经网络.str 统计方法.str 聚类分析.str 药物研究.str 读入数据.str
2021-07-11 16:07:50 4.39MB 数据挖掘 clementine 案例数据 实验数据