CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。
CBT 数据集由 Facebook 于 2016 年发布,主要发布人有 Felix Hill、Antoine Bordes、Sumit Chopra 和 Jason Weston,相关论文有《The Goldilocks Principle: Reading Children’s Books with Explicit Memory Representations》。
2022-07-13 16:05:10
113.3MB
数据集