文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自,下载地址: 。 第1部分:基于scikit-learn机器学习的文本分类方法 基于scikit-
2024-06-24 14:49:13 208KB python nlp machine-learning deep-learning
1
1.2 项目目标 使用机器学习 和 情感词典 这两种方法 分别对中文新闻类文本进行情感极性分析 输入一段新闻文本能够得到文本的情感极性 1.3 目标人群 需要对已有中文文本数据进行情感分析的企业及用户 APP中需要集成中文文本情感分析功能的开发人员 从事中文文本情感分析与挖掘的研究人员
2023-03-14 20:55:17 28.28MB 情感分析 中文 毕业设计
1
针对实际交通场景下的车辆目标,应用深度学习目标分类算法中具有代表性的Faster R-CNN框架,结合ImageNet中的车辆数据集,把场景中的目标检测问题转换为目标的二分类问题,进行车辆目标的检测识别。相比传统机器学习目标检测算法,基于深度学习的目标检测算法在检测准确度和执行效率上优势明显。通过本实验结果分析表明,该方法在识别精度以及速度上均取得了显著的提高。
1
随机森林图像matlab代码步步森林 StepForest:使用局部强度和纹理特征分割结肠组织学图像中腺体的机器学习方法 为在结肠组织学图像中进行腺体分割而创建的基于机器学习的图像分割算法,可以针对其他图像分割问题进行修改。 该算法使用一种新颖的分层随机森林方法,其中使用3个级别的随机森林beeen来进行更好的分割。 为了测试该算法,使用了GlaS @ MICCAI'2015:腺体分割挑战赛()的数据集。 可在上述网站的“下载”标签下下载。 使用的第三方工具箱/代码(由相应作者提供的许可控制):- haralickTextureFeatures由Rune Monzel() Matlab的污点归一化工具箱,作者是Warwick大学的Nicholas Trahearn和Adnan Khan(),这些第三方工具箱/代码的源代码已上传到“工具箱”文件夹下。 可以下载最新版本,并可以从给定的网站获取许可证信息 这项研究是由Rupali Khatun进行的。 这项工作最初是在加尔各答的印度统计研究所(ISI)的电子和通信科学部门(ECSU)以及印度统计研究所(ISI)的印度模式识别和人工智能部门(
2023-03-07 12:57:08 7.89MB 系统开源
1
李航博士《统计学习方法》课件。。。。。。。。。。。
2023-03-07 00:29:46 15.2MB 李航
1
BM3D代码matlab denoising_dl 基于深度学习和其他机器学习方法的图像或视频降噪。 该程序将探索许多神经网络对静止图像进行降噪,并且将来还将扩展到视频降噪。 当前,已实现具有批处理归一化的MLP / CNN / CNN。 比较的黄金程序是BM3D,python版本来自:。 经过测试,最终结果与BM3D matlab不同。 让我们使用matlab作为参考代码。 原始python代码git:原始BM3D是matlab版本,在这里: 有一些BM3D源代码:VapourSynth-BM3D:这是围绕Marc Lebrun的BM3d实现的python包装器:
2023-03-04 10:15:42 71.05MB 系统开源
1
深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar
2023-03-01 16:30:51 19.68MB 深度学习
1
自述文件 该存储库包含该论文的数据,代码,预训练的模型和实验结果: [SEntiMoji:由Emoji推动的用于软件工程中情感分析的学习方法] 。 森蒂莫吉 这项研究提出了SEntiMoji,它利用来自Github和Twitter的包含表情符号的文本来改善软件工程(SE)领域中的情感分析和情感检测任务。 事实证明,SEntiMoji能够在代表性的基准数据集上显着胜过现有的SE自定义情感分析和情感检测方法。 总览 data/包含本研究中使用的数据。 它包含两个子文件夹: GitHub_data/包含用于训练SEntiMoji的已处理表情文字。 benchmark_dataset/包含用于评估
1
统计学习,包含很多数学知识,在学习数值分析,数据分析,本书能够提供详细的数学方面统计的知识,理工科研究生必备所读的书。分享给大家一起学习!
2023-01-27 21:19:27 32.47MB lihang
1
2012.李航.统计学习方法 各种分类算法
2023-01-09 21:20:00 17.03MB 李航 统计学习方法
1