生物医学实体关系抽取是生物医学文本挖掘领域的一项重要任务,它可以自动从生物医学文本中挖掘实 体间的相互关系 目前,生物医学实体关系抽取方法一般只针对某一特定任务(如药物关系,蛋白质交互关系抽取 等)训练单任务模型进行抽取,忽略了多个任务之间的相关性 因此,该文使用基于神经网络的多任务学习方法对 多个生物医学关系抽取任务间的关联性进行了探索 首先构建了全共享模型和私有共享模型,然后在此基础上提 出了一种基于Attention机制的主辅多任务模型 在生物医学领域关系抽取的5个公开数据集上的实验结果表 明,该文的多任务学习方法可以有效地在学习任务之间共享信息,使得任务间互相促进,获得了比单任务方法更好 的关系抽取结果
1
运行该项目的模型训练和模型预测脚本需要准备BERT中文版的模型数据,下载网址为: 。   利用笔者自己收集的3881个样本,对人物关系抽取进行尝试。人物关系共分为14类,如下: { "unknown": 0, "夫妻": 1, "父母": 2, "兄弟姐妹": 3, "上下级": 4, "师生": 5, "好友": 6, "同学": 7, "合作": 8, "同人": 9, "情侣": 10, "祖孙": 11, "同门": 12, "亲戚": 13 }   人物关系类别频数分布条形图如下:   模型结构: BERT + 双向GRU + Attention + FC   模型训练效果: # 训练集(train), loss: 0.0260, acc: 0.9941 # 最终测试集(test), loss: 0.9505, acc:
2021-09-03 20:56:57 690KB Python
1
关系抽取数据集
2021-08-26 14:12:06 4.66MB 关系抽取
1
我们提供NYT数据集,该数据集一共包含233081实体对,由FreeBase对齐,关系数量为57(如果使用53关系的可自行过滤多余的关系及句子)。
2021-08-23 22:31:11 72.68MB 远程监督关系抽取 distant supervis NLP
1
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠 定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。
2021-08-20 01:38:04 2.04MB #资源达人分享计划# 远程监督
1
此文档为博士论文,全面介绍了对中文自然语言进行处理的一些技术
2021-08-18 11:26:32 5.28MB 自然语言 核函数 实体关系 隐马尔科夫
1
农业知识图谱(AgriKG):农业领域的信息检索,命名实体识别,关系抽取,智能问答,辅助决策
2021-08-05 09:51:53 350.25MB kg 知识图谱
1
本文回顾了现有的RE方法,分析了当前面临的关键挑战,为更强大的RE指明了希望的方向,希望我们的观点能够推动这一领域的发展,激励社会做出更大的努力。
2021-06-21 14:58:14 6.93MB OpenRE
1
基于几个可用的NER和RE数据集定义了7个实体标签和9个关系标签。实体(Entity):每个实体都由带有多个属性的T标签标识。关系(Relation):每个关系由R标签标识,该标签可以具有多个属性。
1
公斤基线火炬 2019百度的关系撤回比赛,Pytorch版苏神的基线,联合关系撤回。 模型 与苏神的模型相同,只不过开发框架由Keras + Tensorflow变成了Pytorch,给使用Pytorch的小伙伴分享。 苏神Keras版链接: : 代码中包含了许多苏神的代码,因此首先对苏神表示感谢! 以下为苏神模型介绍 用BiLSTM做联合标注,先预测subject,然后根据suject同时预测object和predicate,标注结构是“半指针-半标注”结构,以前也曾介绍过( https://kexue.fm/archives/5409 ) 标注结构是自己设计的,我看了很多关系抽取的论文
2021-06-16 12:15:54 16KB nlp deep-learning python3 pytorch
1