搜索【中文新闻文本分类】的结果

基于 LSTM-Attention 的中文新闻文本分类

引入Attention 机制，对 LSTM 模型进行改进，设计了LSTM-Attention 模型。实验环境：开python3.6.5、tensorflow==1.12、keras==2.2.4 本文的实验数据集来源于搜狗实验室中的搜狐新闻数据，从中提取出用于训练中文词向量的中文语料，大小约为 4GB 左右．然后选取了10 个类别的新闻数据，分别为体育, 财经, 房产, 家居, 教育, 科技, 时尚, 时政, 游戏, 娱乐．每个类别新闻为5000 条，共 50000 条新闻，利用这 50000 条数据来训练模型．其测试集和验证集如下验证集: 500*10 测试集: 1000*10

2021-12-15 14:09:01 48.56MB LSTM-Attention 中文新闻文本分类 LSTM 注意力机制

toutiao-text-classfication-dataset:今日头条中文新闻（文本）分类数据集-源码

中文文本分类数据集数据来源：今日头条客户端数据格式： 6552431613437805063_!_102_!_news_entertainment_!_谢娜为李浩菲澄清网络谣言，之后她的两个行为给自己加分_!_佟丽娅,网络谣言,快乐大本营,李浩菲,谢娜,观众们每行为一条数据，以_!_分割的个字段，从前往后分别是新闻ID，分类code（见下文），分类名称（见下文），新闻字符串（仅含标题），新闻关键词分类code与名称： 100 民生故事 news_story 101 文化文化 news_culture 102 娱乐娱乐 news_entertainment 103 体育体育 news_sports 104 财经财经 news_finance 106 房产房产 news_house 107 汽车汽车 news_car 108 教育教育 news_edu 109 科

2021-07-12 16:12:23 25.67MB Python

1

基于LSTM_Attention的中文新闻文本分类.caj

经典的LSTM分类模型，一种是利用LSTM最后时刻的输出作为高一级的表示，而另一种是将所有时刻的LSTM输出求平均作为高一级的表示．这两种表示都存在一定的缺陷，第一种缺失了前面的输出信息，另一种没有体现每个时刻输出信息的不同重要程度．为了解决此问题，引入 Attention 机制，对 LSTM 模型进行改进，设计了 LSTM-Attention 模型．实验结果表明: LSTM 分类模型比传统的机器学习方法分类效果更好，而引入 Attention 机制后的 LSTM 模型相比于经典的文本分类模型，分类效果也有了一定程度的提升．

2021-04-14 13:05:15 468KB LSTM Attention

1

个人信息

热门下载

最新下载

其他资源