【自然语言处理】基于高效多源监督的文档级关系抽取增强方法:利用远监督数据提升模型性能与时间效率

上传者: yanceyxin | 上传时间: 2026-03-10 11:29:39 | 文件大小: 310KB | 文件类型: PDF
内容概要:本文提出了一种名为Efficient Multi-Supervision(EMS)的方法,旨在高效利用远距离监督数据(DS数据)来增强文档级关系抽取(DocRE)模型的性能。与传统方法不同,EMS通过两个关键组件实现这一目标:文档信息量排序(DIR)和多源监督排名损失(MSRL)。DIR从大规模DS数据集中筛选出最具信息量的文档,形成增强数据集;MSRL则通过整合来自远距离监督、专家预测和自监督的多源信息,减轻噪声标签的影响,提高训练效率和模型性能。实验结果表明,EMS不仅显著提升了DocRE模型的表现,还大幅减少了训练时间。 适用人群:从事自然语言处理(NLP)研究的专业人士,特别是关注文档级关系抽取领域的研究人员和工程师。 使用场景及目标:①需要高效利用大规模远距离监督数据来提升文档级关系抽取模型性能的研究;②希望减少预训练时间和成本,同时保持或提高模型精度的应用场景。 其他说明:本文展示了EMS在DocRED数据集上的优越表现,通过对比实验验证了其相对于现有方法的优势。此外,作者还讨论了EMS的局限性和未来改进方向,如对专家模型能力的依赖、增强数据集学习效率较低等问题。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明