## 关于数据集 - 数据集名称:SQuAD - 发布机构:斯坦福大学 Stanford University - 网址:https://rajpurkar.github.io/SQuAD-explorer/ - 大小:0.0341 GB - 简介:斯坦福问答数据集(The Stanford Question Answering Dataset,简称SQuAD)是一个阅读理解数据集,由群众工作者在维基百科文章中提出的问题组成,其中每个问题的答案是来自相应阅读段落的一段文本或跨度,共有500多篇文章中有10万多个问答配对。 斯坦福问答数据集(2.0版本)于2018年由斯坦福大学发布,相关论文为Know What You Don't Know: Unanswerable Questions for SQuAD。
2023-12-22 16:48:28 7.43MB 阅读理解数据集 机器学习
1
Maluuba News QA 是一种用于机器阅读理解的数据集,其包含开发能够回答人类问题和推理问题的相关 算法 ,该数据集包含 12 万问答对,均基于人类自然语言编写。 Maluuba News QA 数据集由微软于 2016 年发布,相关论文有《NewsQA: A Machine Comprehension Dataset》。
2022-07-13 16:05:34 7.29MB 数据集
MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。 MSMARCO 数据集由微软于 2016 年发布,并在 2018 年更新,此外,该数据集拥有对应的排名比赛。
2022-07-13 16:05:28 262.54MB 数据集
中文句子填空式机器阅读理解数据集 - CMRC2019.zip
2022-06-16 11:03:42 10.18MB 数据集
CMU 公开的RACE数据集,原来是txt文件,不方便读取。这个版本是json数据集,做了简单的格式调整,python使用起来更方便。
2021-12-04 09:22:50 1.65MB RACE json NLP
1
MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。 eval_v2.1_public.json dev_v2.1.json
2021-10-12 21:52:34 259.81MB 数据集
1
机器阅读理解数据集(中文法研杯数据)这个数据集比较干净. 比起百度的DuReader数据集. 只有训练集.可以做相关研究...加油机油机油哇
2021-08-10 20:08:30 5.86MB MRC 法研杯 阅读理解数据集 NLP
1
2020法研杯阅读理解数据集.zip
2021-07-13 17:08:35 7.1MB 数据集
1
这是从Qangaroo官方网站下载的。官网只公开训练集和测试集,验证集不公开。
2021-05-25 18:35:10 84.34MB 自然语言处理数据集
1
squad-v1.1的数据集,包括训练集和开发集两个json文件。squad是机器阅读理解受众非常广的数据集,提供数据资源以进行实验。
2021-03-17 22:02:28 7.22MB 机器阅读理解 数据集
1