路透社数据集,它包含许多短新闻及其对应的主题,由路透社在 1986 年发布。它 是一个简单的、广泛使用的文本分类数据集。它包括 46 个不同的主题:某些主题的样本更多, 但训练集中每个主题都有至少 10 个样本。 与 IMDB 和 MNIST 类似,路透社数据集也内置为 Keras 的一部分。
2022-11-24 17:36:36 2.22MB 深度学习 路透社 reuters kears
1
路透社数据集 数据集 新闻分类
2022-07-06 16:06:44 2.22MB 数据集 机器学习 深度学习
1
新闻收获 从美联社,彭博社和路透社收集新闻头条和新闻报道的软件包 使用以下代码收集标题和相应的数据: from NewsHarvest.NewsHarvest import AssocitedPress, Reuters, Bloomberg from NewsHavest.utilities import * ap_data = AssociatedPress().get_data() reuters_data = Reuters().get_data() bloomberg_data = Bloomberg().get_data() get_data()方法接受以下参数: get_content=True这确定您是否要从标题的网址中抓取所有可见的文本 sleep=True确定每个标题刮擦之间是否有一秒钟的停顿 json_format=False设置为True时,它将以json格式输
2022-06-17 17:21:46 23KB Python
1
征兵数据 来自路透社,可用于机器学习,文本自组织,聚类算法的真实数据
2021-11-11 18:39:04 6.16MB 征兵数据 来自路透社
1
2015路透社新闻数据集,可以测试用没有问题
2019-12-21 19:53:20 7.77MB mahoout 数据集
1