文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自,下载地址: 。 第1部分:基于scikit-learn机器学习的文本分类方法 基于scikit-
2024-06-24 14:49:13 208KB python nlp machine-learning deep-learning
1
音乐风格分类,使用sklearn中的随机森林,包含数据集清理,特征选择,模型的选择和超参数调参,模型训练,数据可视化等。 包含数据集和jupyter代码,可以直接运行。
2024-06-24 13:51:42 564KB sklearn 机器学习
1
对于众包任务根据已执行的任务信息,进行重新定价优化。首先用线性回归分析,发现线性回归解决不了该问题,转而使用神经网络进行回归分析,回归分析根据模型去修正原来些未完成的任务的单价。最后使用已完成的任务和支持向量机生成模型,去预测那些原本未完成并修正单价后,他们中可能完成的任务数。结果发现,经过优化定价后,未完成的任务可能完成数会增加53个,而未完成任务的总体金额优化前后却省了42
2024-06-23 17:58:21 1.04MB 神经网络 机器学习
1
机器学习问题解决指南 机器学习是一门复杂的学科,需要掌握多种技术和概念。Approaching (Almost) Any Machine Learning Problem是一本旨在帮助读者掌握机器学习问题解决方法的书籍。这本书涵盖了机器学习的基本概念、模型选择、数据预处理、特征工程、模型评估等多方面的知识点。 机器学习基本概念 机器学习是一种人工智能技术,通过对数据的分析和学习,可以对未知数据进行预测和分类。机器学习可以分为监督学习、非监督学习和半监督学习三种类型。监督学习是指在给定标签的数据集上训练模型,以便对新数据进行预测。非监督学习是指在没有标签的数据集上训练模型,以便发现隐含的模式。半监督学习是指在部分标签的数据集上训练模型,以便对新数据进行预测。 模型选择 机器学习模型的选择取决于问题的类型和数据特征。常见的机器学习模型有决策树、随机森林、支持向量机、神经网络等。决策树是一种基于树形结构的分类模型,适合处理小规模数据集。随机森林是一种集成学习模型,通过组合多棵决策树以提高预测准确性。支持向量机是一种基于核函数的分类模型,适合处理高维数据。神经网络是一种基于人工神经网络的分类模型,适合处理大规模数据集。 数据预处理 数据预处理是机器学习的重要步骤,旨在将原始数据转换为模型可以处理的格式。常见的数据预处理方法包括数据清洗、数据变换、特征选择等。数据清洗是指去除无关数据和缺失值,提高数据质量。数据变换是指将数据转换为适合模型的格式。特征选择是指选择最相关的特征,以提高模型的预测准确性。 特征工程 特征工程是指对原始数据特征的提取和转换,以提高模型的预测准确性。常见的特征工程方法包括特征提取、特征选择、特征降维等。特征提取是指将原始数据转换为有意义的特征。特征选择是指选择最相关的特征,以提高模型的预测准确性。特征降维是指降低数据维度,以提高模型的计算效率。 模型评估 模型评估是指对模型的预测结果进行评估,以验证模型的泛化能力。常见的模型评估方法包括准确率、召回率、F1-score、ROC曲线等。准确率是指模型正确预测的样本数占总样本数的比例。召回率是指模型正确预测的正样本数占总正样本数的比例。F1-score是指模型的准确率和召回率的调和平均值。ROC曲线是指模型的真阳性率与假阳性率的曲线。 Approaching (Almost) Any Machine Learning Problem是一本涵盖机器学习基本概念、模型选择、数据预处理、特征工程、模型评估等多方面知识点的书籍,旨在帮助读者掌握机器学习问题解决方法。
2024-06-21 15:45:57 7.98MB 机器学习
1
使用scikit-learn库中的MLPClassifier(多层感知器分类器)对MNIST手写数字数据集进行训练和评估的示例,神经网络-多层感知机分类器精度分析Python代码,包括分类报告、混淆矩阵、模型准确率等内容可视化
2024-06-20 22:41:23 597KB 神经网络 python 机器学习
1
1. Matlab实现BP神经网络的数据分类预测(完整源码和数据) 2. 多变量输入,单变量输出(类别),数据分类预测 3. 评价指标包括:准确率 和 混淆矩阵 4. 包括拟合效果图 和 混淆矩阵 5. Excel数据,要求 Matlab 2018B及以上版本
2024-06-19 17:35:12 73KB 机器学习 神经网络 Matlab 分类算法
1
西电机器学习三个实验具体代码和模型以及实验报告
2024-06-19 14:16:27 115.11MB 机器学习
1
1、资源内容:机器学习大作业-图像识别-安检识别+实验报告+源代码+文档说明+YOLOv5,python实现 2、代码特点:内含运行结果,不会运行可私信,参数化编程、参数可方便更改、代码编程思路清晰、注释明细,都经过测试运行成功,功能ok的情况下才上传的。 3、适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。 4、作者介绍:某大厂资深算法工程师,从事Matlab、Python、C/C++、Java、YOLO算法仿真工作10年;擅长计算机视觉、 目标检测模型、智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、智能控制、路径规划、无人机等多种领域的算法仿真实验,更多源码,请上博主主页搜索。 -------------------------------------------------------------------------- -
2024-06-16 15:20:59 544KB 机器学习 python
机器学习(变分贝叶斯、粒子滤波及边缘PF,内容包括大量课件、MATLAB代码)
2024-06-14 20:31:13 64.48MB matlab 变分贝叶斯 机器学习 粒子滤波
ouc机器学习实验,仅供参考
2024-06-14 16:44:22 7.8MB 机器学习
1