基于CNN的中文文本分类算法(可应用于垃圾邮件过滤、情感分析等场景)
2024-04-14 09:54:07 13.33MB
1
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善。
2022-11-11 09:20:13 189KB 自然科学 论文
1
如今NLP可以说是预训练模型的时代,希望借此抛砖引玉,能多多交流探讨当前预训练模型在文本分类上的应用。 1. 任务介绍与实际应用 文本分类任务是自然语言处理(NLP)中最常见、最基础的任务之一,顾名思
2022-09-19 09:00:14 139KB 技术
1
几种常用文本分类算法性能比较与分析.docx
2022-05-30 09:08:51 236KB 文档资料 分类 数据挖掘 人工智能
基于TensorFlow、CNN、清华数据集THUCNews的字符级卷积神经网络实现文本分类算法源码
2022-05-12 19:02:06 48.72MB tensorflow 源码软件 cnn 分类
1
大数据-算法-高性能特征选择及文本分类算法研究.pdf
2022-05-05 14:05:02 2.45MB 算法 文档资料 big data
随 着 大数据 时 代 的 快速发 展 , 文 本 信 息 数据 量 急 剧 增 加 , 为 了 获 取有 价值 的 信 息 , 提升 信 息 获取 效 率 , 就 需 对这些文本信 息进 行分类 。 因 此 , 文 本分类系 统 的 研 究 与 实 现具 有 重要 意 义 。 新 闻 文本 是 文本信 息 的一个重 要组成部分 , 也 是人 们 获取 信 息 的重要 方式 。 本 文 以 新 闻 文本 分类为依 托 , 对 当 下 文本分类算法进 行 改进 , 以 新 闻 文本分类系 统 为 实例 对文 本 分类系 统 的 设计 与 实 现进 行 说 明 , 完 成 文 本 分类算法 的 研 究工 作 。 本文 以 大数据 时代背 景及 分类技术 的 发 展为背景 , 对 贝 叶斯 分类 算 法 以 及 卷积 神 经 网 络 分类 算 法进 行 了 改进 , 以 提升 分类 的 准确 度 , 主 要 工作 内 容 有 以 下 几个方面 : 第一, 本 文 针对 不 同 种 类 的 文本 分类方 法做 了 调 研 , 通过 阅 读 文
2022-04-28 09:09:16 7.18MB 机器学习 分类 人工智能 数据挖掘
采用XML做数据库存储样本特征库,进行样本训练,可以直接加载词典后进行分本分类。也可以清空样本库,重新选择样本库进行训练
2022-03-29 14:43:53 114KB 贝叶斯-KNN,文本分类
1
基于朴素贝叶斯分类器的文本分类算法(C语言)
2022-03-13 11:06:41 39KB 基于 朴素 贝叶斯 分类
1
利用TF-IDF策略的中文文本分类算法比较,刘昕玥,王敬,本文基于TF-IDF特征选取方法,分别使用朴素贝叶斯、随机森林与支持向量机算法对中文文本语料库进行分类实验。实验表明,支持向量机
2022-02-24 20:56:18 538KB 首发论文
1