人工智能-项目实践-文本分类-CNN-RNN中文文本分类,基于TensorFlow 使用卷积神经网络以及循环神经网络进行中文文本分类 CNN做句子分类的论文可以参看: Convolutional Neural Networks for Sentence Classification 以及字符级CNN的论文:Character-level Convolutional Networks for Text Classification 本文是基于TensorFlow在中文数据集上的简化实现,使用了字符级CNN和RNN对中文文本进行分类,达到了较好的效果。 文中所使用的Conv1D与论文中有些不同,详细参考官方文档:tf.nn.conv1d
2022-05-13 09:08:46 410KB 文档资料 cnn rnn tensorflow
随 着 大数据 时 代 的 快速发 展 , 文 本 信 息 数据 量 急 剧 增 加 , 为 了 获 取有 价值 的 信 息 , 提升 信 息 获取 效 率 , 就 需 对这些文本信 息进 行分类 。 因 此 , 文 本分类系 统 的 研 究 与 实 现具 有 重要 意 义 。 新 闻 文本 是 文本信 息 的一个重 要组成部分 , 也 是人 们 获取 信 息 的重要 方式 。 本 文 以 新 闻 文本 分类为依 托 , 对 当 下 文本分类算法进 行 改进 , 以 新 闻 文本分类系 统 为 实例 对文 本 分类系 统 的 设计 与 实 现进 行 说 明 , 完 成 文 本 分类算法 的 研 究工 作 。 本文 以 大数据 时代背 景及 分类技术 的 发 展为背景 , 对 贝 叶斯 分类 算 法 以 及 卷积 神 经 网 络 分类 算 法进 行 了 改进 , 以 提升 分类 的 准确 度 , 主 要 工作 内 容 有 以 下 几个方面 : 第一, 本 文 针对 不 同 种 类 的 文本 分类方 法做 了 调 研 , 通过 阅 读 文
2022-04-28 09:09:16 7.18MB 机器学习 分类 人工智能 数据挖掘
这个链接是测试集,训练集请见这个链接: 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-04-26 22:51:22 51.14MB 中文文本分类 文本分类语料
1
中文文本分类停用词1208个中文文本分类停用词1208个中文文本分类停用词1208个
2022-03-30 11:47:56 3KB 停用词
1
利用tensorflow的中文文本分类程序,包括CNN和RNN实现,程序结构清晰,便于学习理解。
2022-03-29 22:57:55 410KB 中文文本分类 CNN tensorflow
1
是一个不错的中文分类器,里面包括knn 和svm分类法。李荣陆的作品。安装后即可使用。
2022-03-24 09:21:20 16.61MB 分类器 中文
1
chinese_text_classification 通过一个中文文本分类问题系统实现了各种分类方法 数据来源 数据搜狗新闻 类别 有汽车,娱乐,军事,体育,技术五种类别。原始数据比较大,没有上传,分词,去除重组词之后的数据放在processed_data文件夹下。 分类算法 主要实现了以下分类算法: NB(朴素贝叶斯) 支持向量机 快速文本 text_CNN text_RNN text_RCNN text_Bi_LSTM text_Attention_Bi_LSTM HAN(分层注意网络) 埃尔莫 分类准确率 分类准确率都在90%附近,没有进行过多预处理,只为熟悉算法的使用。 依赖库 基于tensorflow2.0实现,可以在win和linux下运行。觉得有用的点个赞,谢谢。
2022-03-02 22:16:24 6.73MB 系统开源
1
利用TF-IDF策略的中文文本分类算法比较,刘昕玥,王敬,本文基于TF-IDF特征选取方法,分别使用朴素贝叶斯、随机森林与支持向量机算法对中文文本语料库进行分类实验。实验表明,支持向量机
2022-02-24 20:56:18 538KB 首发论文
1
文本分类语料,共9833篇文档;train为训练语料,test为测试语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分;
2022-01-17 14:16:20 105.11MB 复旦 文本分类 语料 文本分类语料
1