Zillow预测模型:使用Kaggle数据集的机器学习项目
2021-10-20 19:30:28 2.24MB machine-learning numpy scikit-learn eda
1
机器学习:有关虚假新闻预测的机器学习项目
2021-10-17 20:51:50 1.16MB JupyterNotebook
1
构建设置 # install python libraries pip install -r requirements.txt # run the server python app.py # install dependencies npm install # serve with hot reload at localhost:8080 npm run dev # build for production with minification npm run build # build for production and view the bundle analyzer report np
1
机器学习项目 我所有有关机器学习的实践项目的集合 乳腺癌数据集:支持向量机 脊柱后凸数据集:决策树和随机森林 贷款数据集:决策树和随机森林 泰坦尼克号数据集:逻辑回归 葡萄酒质量数据集:决策树和随机森林 波士顿数据集:线性回归 虹膜数据集:支持向量机
2021-09-27 18:26:32 4.55MB JupyterNotebook
1
本文来自于cloud.tencent.com,作者以浅显易懂的语言和清晰的示例和代码教你从头开始走过一个机器学习之旅,并且附详细的代码,大家可以收藏和学习。这是一篇完全手把手进行机器学习项目构建的教程,包含:1.数据清理和格式化2.探索性数据分析3.特征工程和特征选择4.在性能指标上比较几种机器学习模型5.对最佳模型执行超参数调整6.在测试集合中评估最佳模型7.解释模型结果8.得出结论。今天是(1-3)从数据清理,到数据分析,到特征工程,再到Baseline的构建.——Puttingthemachinelearningpiecestogether阅读一本数据科学书籍或学习一门相关的课程,你可能
2021-09-11 16:39:19 435KB Python机器学习项目实战
1
matlab 10折交叉验证知识代码分类算法评估 介绍 该项目的目标是基于以下内容评估一组分类器: 准确性 敏感性和 特异性 资料集 该项目使用的数据集是从乳腺癌数据库中获得的,可以找到。 快速描述如下: 实例数为699。 每个实例具有2种可能的类别之一:良性(65.5%)或恶性(34.5%),分别由2和4表示,稍后用-1和1代替。 每个实例具有9个按[1-10]比例缩放的属性以及类标签。 缺失的属性(总共16个)被替换为最常出现的值。 分类器 在此项目中评估的分类器以及为其属性设置的值是: 贝叶斯 概率分类器,通过基于实例具有的属性值来估计该实例最有可能属于哪个类,从而为该实例分配一个类标签。 先验概率根据data-description.txt,将良性和恶性分别设置为0.655和0.345的那些 K最近邻居 在这种情况下,对象通过其邻居的多次投票进行分类。 打破领带 如果是平局,则使用最接近的级别。 k选择 为了优化性能,将k设置为训练集大小的平方根。 通常,较大的k值会减少噪声对分类的影响,但会使类别之间的界限不那么明显。 邻居效应 为了使距离较近的邻居比距离较远的邻居贡献更多,
2021-09-03 09:14:16 33KB 系统开源
1
机器学习项目实战】Python实现聚类(Kmeans)分析客户分组 资料说明:包括数据集+源代码+Word文档说明。 资料内容包括: 1)问题定义; 2)数据收集; 3)数预处理; 4)探索性数据分析; 5)聚类模型; 6)聚类可视化; 7)实际应用。
Python实现GA(遗传算法)对SVM分类模型参数的优化资料说明:包括数据集+源代码+Word文档说明。 资料内容包括: 1)需求分析; 2)数据采集; 3)数据预处理; 4)探索性数据分析; 5)特征工程; 6)机器建模; 7)模型评估; 8)实际应用
2021-08-17 09:08:17 1.45MB python GA遗传算法 SVM优化 机器学习
该资源为本人博客中项目的代码及数据,主要是提供需要的人,让他们对博客内容有充分的理解
2021-07-05 10:03:56 2.37MB ML
1