人工智能-项目实践-文本分类-CNN-RNN中文文本分类,基于TensorFlow 使用卷积神经网络以及循环神经网络进行中文文本分类 CNN做句子分类的论文可以参看: Convolutional Neural Networks for Sentence Classification 以及字符级CNN的论文:Character-level Convolutional Networks for Text Classification 本文是基于TensorFlow在中文数据集上的简化实现,使用了字符级CNN和RNN对中文文本进行分类,达到了较好的效果。 文中所使用的Conv1D与论文中有些不同,详细参考官方文档:tf.nn.conv1d
2022-05-13 09:08:46 410KB 文档资料 cnn rnn tensorflow
Ekho是一个把文字转换成声音的软件。它目前支持粤语、普通话(国语)、诏安客语、藏语、雅言(中国古代通用语)和韩语(试验中),英文则通过Festival间接实现。支持Linux。
2022-05-05 19:57:31 75.13MB 文本转语音
1
随 着 大数据 时 代 的 快速发 展 , 文 本 信 息 数据 量 急 剧 增 加 , 为 了 获 取有 价值 的 信 息 , 提升 信 息 获取 效 率 , 就 需 对这些文本信 息进 行分类 。 因 此 , 文 本分类系 统 的 研 究 与 实 现具 有 重要 意 义 。 新 闻 文本 是 文本信 息 的一个重 要组成部分 , 也 是人 们 获取 信 息 的重要 方式 。 本 文 以 新 闻 文本 分类为依 托 , 对 当 下 文本分类算法进 行 改进 , 以 新 闻 文本分类系 统 为 实例 对文 本 分类系 统 的 设计 与 实 现进 行 说 明 , 完 成 文 本 分类算法 的 研 究工 作 。 本文 以 大数据 时代背 景及 分类技术 的 发 展为背景 , 对 贝 叶斯 分类 算 法 以 及 卷积 神 经 网 络 分类 算 法进 行 了 改进 , 以 提升 分类 的 准确 度 , 主 要 工作 内 容 有 以 下 几个方面 : 第一, 本 文 针对 不 同 种 类 的 文本 分类方 法做 了 调 研 , 通过 阅 读 文
2022-04-28 09:09:16 7.18MB 机器学习 分类 人工智能 数据挖掘
随着计算机技术、网络技术、数据库技术的快速发展与普及应用,网络信息爆炸式 增长,而其中绝大部分信息以文本形式存在。如何从这海量的信息中快速高效的获取数 据,成为信息处理领域亟待解决的问题。文本自动分类技术作为处理和组织大量文本数 据的关键技术应运而生并取得了快速的发展。 基于主题的文本分类是根据文本的内容将文本划分到预先定义好的类别中去。机器 学习方法由于其自身的灵活性并能够取得较好的分类效果,因此在文本分类中得到了广 泛的应用。机器学习方法要经过文本的预处理,特征选择,特征加权,训练分类器并进 行分类等过程。特征加权是文本分类中的重要环节,对文本的分类性能有直接的影响。 通过考察传统的特征选择函数,发现互信息方法在特征加权过程中表现尤为突出。为了 提高互信息方法在特征加权时的性能,加入了词频信息、文档频率信息以及类别相关度 因子,提出了一种基于改进的互信息特征加权方法,实验表明,该方法比传统的特征加 权方法TFIDF具有更好的分类性能。 情感分类是文本分类的重要分支,它已经逐渐成为了信息检索和自然语言处理领域 的热点研究问题。机器学习方法同样适用于文本的情感分类,但是其效果却与传统的
2022-04-27 16:05:45 7.62MB 机器学习 分类 文档资料 人工智能
这个链接是测试集,训练集请见这个链接: 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-04-26 22:51:22 51.14MB 中文文本分类 文本分类语料
1
使用CRF随机条件场进行中文文本分词,基于python已调通,带数据集
2022-04-19 23:14:11 16.32MB CRF条件随机场 中文分词 自然语言处理
1
代码主要实现分词并获取关键词,并附有停止词(文本分词时,删除停用词)
2022-04-19 14:01:08 7KB tfidf
1
中文文本分类停用词1208个中文文本分类停用词1208个中文文本分类停用词1208个
2022-03-30 11:47:56 3KB 停用词
1
利用tensorflow的中文文本分类程序,包括CNN和RNN实现,程序结构清晰,便于学习理解。
2022-03-29 22:57:55 410KB 中文文本分类 CNN tensorflow
1