matlab代码lasso data_mining/数据挖掘 data_analysis 一、十六种回归算法 01)LineaRegrssion 02)KNeighuborsRegresspr 03)SVR 04)Lasso 05)Ridge 06)MLPRegressor 07)DecisionTreeRegressor 08)ExtraTreeRegressor 09)AdaBoostRegressor 10)GradientBoostingRegressor 11)BaggingRegressor 12)XGBRegrrssor 13)RandomFroestRegressor 14)Xgbosst 15)LightGBM 16)Catboost 17)Ngboost 二、 Gaussian Naive Bayes (GNB) Bernoulli Naive Bayes (BNB) Multinomial Naive Bayes (MNB) Logistic Regression (LR) Stochastic Gradient Descent (SGD) Passive Agg
2021-09-11 22:41:00 2KB 系统开源
1
高效先验 Apriori算法的高效纯Python实现。 适用于Python 3.6及更高版本。 先验算法发现分类数据中的隐藏结构。 经典示例是一个数据库,其中包含从超市购买的商品。 每次购买都有许多与之相关的物品。 我们想从数据中发现关联规则,例如{bread, eggs} -> {bacon} 。 这是的目标,而可以说是解决此问题的最著名算法。 该存储库包含apriori算法的有效,经过测试的实现,如Agrawal等人于1994年发表的中所述。 该代码是稳定的并且被广泛使用。 Bonaccorso在《精通机器学习算法》一书中对此进行了引用。 例子 这是一个最小的工作示例。 请注意,在每次有eggs交易中,也有bacon 。 因此,将以100%的置信度返回规则{eggs} -> {bacon} 。 from efficient_apriori import apriori tran
1
Data Mining Concepts and Techniques 3rd Edition(数据挖掘概念与技术第三版)英文原版
2021-09-06 21:50:03 8.05MB data ming English
1
The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 和之前上传的略有差别,这个要更好。
2021-09-05 23:47:47 8.22MB statistical learning
1
渐变光机 LightGBM是使用基于树的学习算法的梯度增强框架。 它被设计为分布式且高效的,具有以下优点: 训练速度更快,效率更高。 降低内存使用率。 更好的准确性。 支持并行和GPU学习。 能够处理大规模数据。 有关更多详细信息,请参阅。 受益于这些优势,LightGBM被广泛用于许多机器学习竞赛的中。 在公共数据集上进行的表明,LightGBM可以在效率和准确性上均优于现有的Boosting框架,并且显着降低了内存消耗。 此外, 表明,LightGBM可通过使用多台机器进行特定设置的训练来实现线性加速。 入门和文档 我们的主要文档位于并从该存储库生成。 如果您不熟悉LightGBM,请按照站点上进行。 接下来,您可能需要阅读: 显示常见任务命令行用法的。 LightGBM支持的和算法。 是您可以进行的自定义的详尽列表。 和可以加快计算速度。 是有关超参数的详细指南。 为LightGBM超参数()提供自动调整。 贡献者文档: 。 查阅《 。 新闻 请参考页面上的变更日志。 一些重要的更新日志可在“页面上找到。 外部(非官方)存储库 Optun
2021-09-04 16:56:17 7.03MB microsoft python machine-learning data-mining
1
最新的修订版,啃下这个就无敌啦。10th printing with corrections, Jan 2013
2021-08-30 10:58:23 12.69MB machine learning data mining
1
Wiley-Applied Data Mining Statistical Methods For Business And Industry.pdf
2021-08-28 10:45:25 5.56MB Data Mining Statistical Business
1
salesPredict ARIMA模型简介 ARIMA模型提供了基于时间序列理论,对数据进行稳定化处理(AR和MA过程),模型定阶(自动差分过程),参数估计,建立模型,可以进行模型进行检验。在Python中statsmodel提供了完整的的解决方案,包括窗口选择,自动定阶和稳定性检测等等算法。 预测策略 这样的好处是,月上旬和中旬的实际销量可以作为先验知识,提高模型预测的准确率。 环境 Windows 10 Python 3.6.5 依赖包 pip install -r requirements.txt 程序执行 python sales.py 建模过程 预测效果测试 线上预测效果 截至到
2021-08-27 17:44:25 254KB python data-science data data-mining
1
CSMATH-2020 关于本课程 该数学课程是为第一年的博士课程而设计的。计算机科学及相关领域的学生。本课程重点介绍人们当前所需的方法,技术,数学和算法。我们正在竭尽全力为该领域的新手提供数学知识,并提供直观的解释,清晰的概念以及生动的应用示例。该课程包括基础统计学习,非线性优化,偏微分方程和应用函数分析。 有关本课程 本课程教授在计算机科学和信息处理研究领域相关的数学方法论,技术,概念以及基本算法。试图以数学的直观引导,清晰的概念解释,生动的应用实例,为学生开始进入这些领域的研究提供一个数学知识的导引。 本课程的主要教学内容包括多元统计方法初步,非线性优化算法,偏微分方程以及应用泛函方法等四个单元。多元统计方法单元,从统计的角度,对计算机科学中如计算机视觉和模式非线性优化单元称为主流非线性优化方法及其相关特性比较。偏微分方程单元,着重于介绍水平集方法,椭圆方程和泊松方程的替代理论以及相
2021-08-22 18:39:45 118.63MB python machine-learning data-mining mathematics
1
本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。   《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。《数据挖掘导论(完整版)》特色与许多其他同类图书不同,《数据挖掘导论(完整版)》将重点放在如何用数据挖掘知识解决各种实际问题。
2021-08-22 09:47:07 47.53MB Book
1