在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。数据整理是数据预处理的重要扩展。它最适合在可视化分析工具中使用,这能够避免分析流程被打断。可视化分析工具与开源数据科学组件之间,如R、Python、KNIME、RapidMiner互为补充。避免过多地使用组件能够加速数据科学项目。因此,在数据准备步骤中利用流式获取框架或流式分析产品会是一个不错的选择。机器学习和深度学习项目在大多数企业中变得越来越重要。一个完整的项目流程包括数据准备(datapreparation)、构建分析模型
1
机器学习项目 实施各种有监督和无监督的机器学习项目
2021-02-10 12:04:01 5.28MB JupyterNotebook
1
Python机器学习 小型机器学习项目,以了解核心概念(顺序:从最早到最新) 使用带有新闻组20数据集的潜在Dirichlet分配进行主题建模,并使用Python和Scikit-Learn实现 在MNIST数据集上实现了用Keras构建的简单神经网络 使用线性回归的Google股票价格预测 实现了一个简单的社交网络来学习Python基础 实施Naives Bayes分类器以过滤SpamAssasin公共语料库上的垃圾邮件 使用Keras和Scikit-Learn的银行数据集的客户流失预测模型 从零开始实施随机森林,并在UCI存储库的Sonar数据集上建立分类器 示例数据集上Python中的简单线性回归 Python在样本数据集上的多元回归 PCA和使用Python缩放样本股票数据[working_with_data] 示例数据集上Python中的决策树 示例数据集上的Python中的Logistic回归 在Python中建立神经网络以击败验证码系统 辅助方法包括用于统计,概率,线性代数和数据分析的常用运算 用示例数据进行K均值聚类; 用k均值聚类颜色; 自下而上的层次聚类 生成词云
1
机器学习项目,金融反欺诈模型,完整例程,python编写,已测试通过
2019-12-21 21:12:21 9.59MB 人工智能 机器学习 金融反欺诈 PYTHON
1