上传者: yanceyxin
|
上传时间: 2026-03-10 11:29:39
|
文件大小: 310KB
|
文件类型: PDF
内容概要:本文提出了一种名为Efficient Multi-Supervision(EMS)的方法,旨在高效利用远距离监督数据(DS数据)来增强文档级关系抽取(DocRE)模型的性能。与传统方法不同,EMS通过两个关键组件实现这一目标:文档信息量排序(DIR)和多源监督排名损失(MSRL)。DIR从大规模DS数据集中筛选出最具信息量的文档,形成增强数据集;MSRL则通过整合来自远距离监督、专家预测和自监督的多源信息,减轻噪声标签的影响,提高训练效率和模型性能。实验结果表明,EMS不仅显著提升了DocRE模型的表现,还大幅减少了训练时间。
适用人群:从事自然语言处理(NLP)研究的专业人士,特别是关注文档级关系抽取领域的研究人员和工程师。
使用场景及目标:①需要高效利用大规模远距离监督数据来提升文档级关系抽取模型性能的研究;②希望减少预训练时间和成本,同时保持或提高模型精度的应用场景。
其他说明:本文展示了EMS在DocRED数据集上的优越表现,通过对比实验验证了其相对于现有方法的优势。此外,作者还讨论了EMS的局限性和未来改进方向,如对专家模型能力的依赖、增强数据集学习效率较低等问题。