无监督多跳质量检查
该存储库包含该论文的代码和模型: 。
我们提出了MQA-QG,这是一种无监督的问答框架,可以从同构和异构数据源生成类似于人的多跳训练对。
我们发现我们可以仅使用生成的数据来训练胜任的多跳质量检查模型。 在和数据集中,无监督模型和完全监督模型之间的F1差距小于20。
使用我们生成的数据对多跳质量检查模型进行预训练将大大减少对多步质量检查的人工注释训练数据的需求。
介绍
该模型首先定义了一组基本运算符,以从每个输入源检索/生成相关信息或汇总不同的信息,如下所示。
然后,我们定义六个推理图。 每个都对应一种类型的多跳问题,并被公式化为基于运算符的计算图。 我们通过执行推理图来生成多跳问答对。
要求
的Python 3.7.3
火炬1.7.1
tqdm 4.49.0
变压器4.3.3
资料准备
a)HotpotQA
首先,下载hotpotQA的原始数据集。
H
2022-06-16 20:43:53
1.42MB
Python
1