scikit-learn是一个建立在Scipy基础上的用于机器学习的Python模块。scikit-learn包含众多顶级机器学习算法,主要有六大基本功能,分别是分类、回归、聚类、数据将维、模型选择和数据预处理。scikit-learn拥有非常活跃的用户社区,基本上其所有的功能都有非常详尽的文档供用户查阅。可以研读scikit-learn的用户指南及文档,对其算法的使用有更充分的了解。
2021-11-29 11:01:09 6.11MB scikit_learn python 机器学习
1
「风险评估」窥探安卓内核 - 应急响应 系统安全 系统安全 无线安全 安全架构 攻防实训
2021-11-27 09:00:12 1.66MB 信息安全 安全活动 安全架构 scikit-learn
Scikit-learn中文使用手册 基础部分很全面
2021-11-26 22:18:53 2.86MB Scikit-learn
1
/ *日期:2018年5月7日作者:Raj Mehrotra * / 来自kaggle的“红酒质量”数据集。 数据集包含有关葡萄酒样品的详细信息,以及说明葡萄酒中不同化学物质浓度的不同特征。 目标变量是0-10的葡萄酒质量。 我首先探索并分析了数据,并使用了熊猫,matplotlib,seaborn库进行了可视化,并研究了不同类别和数字特征的分布。 然后,我清理了数据并准备好进行建模。然后,我还使用sklearn提供的StandardScaler缩放了所有数字功能以实现更好的性能。 最后,我从scikit学习中使用了不同的ML算法,包括SVM,RandomForest等。 我还使用GridSearchCV函数调整了所有算法的参数。 最后,通过使用带有“ rbf”内核和参数“ C”和“ gamma”的调整值的支持向量机,我在数据集上的精度为0.9175。
2021-11-25 08:01:14 495KB JupyterNotebook
1
使用sklearn库自带的手写数字数据来进行PCA降维后再用K-近邻算法去训练,拥有展示成果功能。
2021-11-24 22:07:56 3KB Python scikit-learn PCA
1
堆叠(堆叠概括) 总览 简单实用的堆叠库,用Python编写。 用户可以使用scikit-learn,XGboost和Keras的模型进行堆叠。 作为该库的功能,训练后可以保存所有失叠的预测以供进一步分析。 描述 (有时被称为堆叠泛化)涉及训练学习算法的其他几个学习算法的预测结合起来。 基本思想是使用一组基础分类器,然后使用另一个分类器组合其预测,以减少泛化误差。 对于理解堆栈和集成学习非常有帮助。 用法 请参阅工作示例: 要运行这些示例,只需运行sh run.sh 注意: 在数据/输入下设置训练和测试数据集 从原始数据集创建的要素必须位于数据/输出/要素下 堆栈模型在scripts文件夹下的scripts.py中定义 需要在该脚本中定义创建的功能 只需运行sh run.sh ( python scripts/XXX.py )。 详细用法 设置火车数据集及其目标数据和测试数据集。 FEATURE_LIST_stage1 = { 'train' :( INPUT_PATH + 'train.csv'
2021-11-24 09:51:14 2.16MB scikit-learn prediction xgboost ensemble
1
mnist分类 使用多种方法完成MNIST分类任务 Python 3.6 火炬1.0 Scikit学习0.21 无需下载数据直接跑,代码自动下载 模型 逻辑回归Logistic回归 多层感知机 K近邻KNN 支持向量机 卷积神经网络 循环神经网络 实验报告 见mnistClassification.pdf 对应的latex原始码: :
2021-11-23 21:28:13 1.04MB machine-learning deep-learning svm scikit-learn
1
安然欺诈项目 休斯顿的安然综合体- 安然是美国最大的公司之一。 由于公司欺诈,它破产了。 由于联邦调查的结果,大量的安然数据(电子邮件和财务数据)已进入公共记录。 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 选型 特征选择与工程 首先,清理数据; 由于我们对个人数据感兴趣,因此删除了与“总计”和“公园旅行社”相对应的数据。 另外,“ LOCKHART EUGENE E”数据全为零,并且也被删除。 一些功能也被删除。 由于“ to
2021-11-21 19:00:23 2.77MB python machine-learning random-forest scikit-learn
1
字符识别:使用机器学习算法(SVM,KNN)从图像中识别字符
2021-11-21 14:02:23 30.79MB python opencv machine-learning scikit-learn
1
嗨,我是RyuzakiBot! 寻找免费的开源聊天机器人? RyuzakiBot是一个简单的基于检索的聊天机器人,使用NLTK和scikit-learn在Python3中从头开始制作。 在此处尝试: : 请注意,该网站已部署在免费的Heroku服务器上,并且首次加载和响应需要一些时间。 使用自己的语料库 如果您想对RyuzakiBot进行其他主题的培训,请自行更改corpus.txt文件。 创建一个不难,每个语料库只是各种输入语句及其对聊天机器人的响应进行训练的样本。 在上面的示例中,它将使用的Wikipedia页面作为语料库。 API REST RyuzakiBot使用了微框架及其扩展,增加了对快速构建REST API的支持: 。 您可以在此处向API发出HTTPS请求: : q=将保留查询,并且所有GET请求都将返回JSON对象。 实作 这个聊天机器人是用Python3编写的,主要使用: NLTK:是自然语言处理(NLP)和人工智能库。 NLTK用于文本预处理(消除噪声,停用词,词干和词形去除)。 请访问了解更多信息。 scikit-learn:是一个数据挖掘和数据
2021-11-21 12:04:25 15KB scikit-learn chatbot python3 nltk
1