员工减员数据分析:对公司进行减员数据集的多个分类(KNN,朴素贝叶斯,随机森林,决策树,ANN,SVM),以预测公司对减员的主要贡献从而提高生产率
2021-10-16 20:17:10 9.03MB JupyterNotebook
1
摘要:分类问题是商业业务中遇到的主要问题之一。本文对三种主要技术展开讨论,逻辑回归(LogisticRegression)、决策树(DecisionTrees)和支持向量机(SupportVectorMachine,SVM)。分类问题是我们在各个行业的商业业务中遇到的主要问题之一。在本文中,我们将从众多技术中挑选出三种主要技术展开讨论,逻辑回归(LogisticRegression)、决策树(DecisionTrees)和支持向量机(SupportVectorMachine,SVM)。上面列出的算法都是用来解决分类问题(SVM和DT也被用于回归,但这不在我们的讨论范围之内)。我
2021-10-16 17:01:10 498KB 逻辑回归、决策树和支持向量机
1
PredictionIO 模板:具有特征重要性的决策树 概述 引擎模板是引擎的几乎完整的实现。 在这个引擎模板中,我们默认集成了 Apache Spark MLlib 的决策树算法。 此回归引擎模板的默认用例是预测的价格。 您可以轻松自定义它以适应您的特定用例和需求。 我们将向您展示如何基于此模板为生产使用创建自己的回归引擎。 用法 与码头工人: 开始使用 predictio 的最佳方法是使用 docker。 从我们的形象 docker run -ti --dns=8.8.8.8 -p 9000:9000 -v /pathTo/template-decision-tree-feature-importance:/MyRegression ants/predictionio:v0.9.1 bash 构建Docker映像 按照的步骤: git clone https://github
2021-10-16 16:32:50 508KB Scala
1
针对目前空气质量预报多采用传统的数值模型现状,例如空气污染指数法,本次研究通过决策树算法以及大规模的训练数据集建立空气质量预测模型。传统的评估模型是在各种污染参数的污染分指数都计算出以后,取最大者为该区域或城市的空气污染指数固定数值区间的划分来评估空气质量。而基于决策树算法的空气质量评估模型通过采用自顶向下的递归方式对数据进行处理,把一个无序、无规则的实例集合归纳成一组树形结构表示的分类规则,得到了将所有污染参数作为评估空气质量因素的评估模型,可以有效的避免传统的空气质量预报模型的不灵活、边界值不准确的特点。同时可以根据季节和地区等外部因素构建不同的空气质量预测模型以应对外部因素的变化,从而可以构建完整,精确,现代化的空气质量智能预测系统。
1
数据科学迷你项目 决策树回归,随机森林和多元线性回归的精度比较 风险资本家雇用您来预测一家初创公司的利润。 因此,您必须处理一个数据集,该数据集包含50个创业公司的详细信息,并根据某些功能预测新创业公司的利润。 根据您的决定和预测,是否应该投资特定的创业公司。 数据集包含以下字段:研究与发展趋势-研发管理支出总额-行政管理支出支出总额-营销市场支出总额-创业公司运营的州利润-获利启动 在应用机器学习算法之前,您必须执行以下任务:1)处理缺失值2)准备数据进行训练和测试3)应用决策树算法训练模型4)应用随机森林回归算法训练模型5)比较线性回归的精度。
2021-10-16 01:04:32 65KB JupyterNotebook
1
用Sklearn中的decision_tree库函数处理多分类问题,里面含有决策树的算法具体内容。
2021-10-15 10:29:00 716KB decision_tre
1
经典的数据挖掘算法决策树C4.5
2021-10-14 18:49:12 146KB 决策树
1
包括讲解决策树算法的PPT与用python实现的能够正常运行的代码。
2021-10-13 18:01:59 3.38MB 决策树
1
此算法为数据挖掘经典分类算法之一-决策树C4.5算法,程序采用java编程,可以帮助初学数据挖掘的朋友进行算法的简单了解和初步的分析。
2021-10-13 17:33:04 519KB 数据挖掘算法
1