Yahoo!Answers 数据集源于 Yahoo!Answers Comprehensive Questions and Answers 1.0 的 10 个主要分类数据,每个类别分别包含 140000 个训练样本和 5000 个测试样本。
该数据集是截至 2007 年 10 月 25 日的答案语料库,其包含问题和对应答案,本语料库包含 4483032 个问题及答案,除此之外还包含少量元数据,可被用于选择最佳答案。
Yahoo!Answers 数据集由康奈尔大学发布。
2022-07-13 16:06:24
304.72MB
数据集