电子病历中包含着医疗领域的丰富知识 ,对于医疗健康信息服务有着重要的意义。 其中的概念实体之间的关系是医疗知识 的重要 组成部分 。对于获取医疗领域中疾病、治疗 、检查之间关系有着重要 的意义 。 针对 于电子病历 中文本结构稀疏 的特 点 ,原有 的基 于词的特征表示效果 有限 ,所以从特征选择的角度出发 ,提出 了一种 基于深度学 习的特征学 习,将 有 限的上下文特征进 行进 一步抽 象表示 的方 法。 实验中使 用深度稀疏 自动编码 来对实体上下文 的向量表示进行 再表示 ,来得 到更抽象 和更有识别 意义 的特征 。 实验 表明 ,本文使用的深度学习进行 特征的再表示方法对 于识别 的召回率对 比于基线实验有 比较明显的提高
2021-10-25 16:24:59 929KB 深度学习 稀疏
1
目前基于深度学习的人物关系抽取方法中大都使用单一的CNN或RNN模型,CNN擅长提取局部的最重要特征,但是不适合处理序列输入,而RNN虽然在任意长度的序列化任务中具有很大的优势,但是对局部的重要特征提取不够充分,针对以上问题,提出一种基于双向GRU和PCNN的人物关系抽取方法。将双向GRU模型与PCNN模型的优点结合起来,同时在模型中加入注意力机制。利用远程监督的方法构建训练语料进行实验验证,结果表明,该方法相较于单一的双向GRU模型、PCNN模型具有更好的效果。
1
远程监督关系抽取,53类关系数据,采用的都是一些主流方法,比如cnn+att,pcnn+att,ResNet+att等
2021-10-09 09:52:51 134.73MB sa
1
2020语言与智能技术竞赛:关系抽取任务测试集。从自然语言文本中抽取实体及其之间关系的信息技术。训练集和验证集也已上传,请自行搜索下载!
1
2020语言与智能技术竞赛:关系抽取任务数据集 DuIE 2.0 验证集;训练集和测试集也会上传,提供下载!
2021-10-08 21:03:01 2.66MB 关系抽取 2020语言与智能技术竞赛
1
Agricultural Knowledge Graph 由于工作原因,该项目已停止维护。因此项目代码仅供参考,项目中包含的数据可免费用于学术等非商业用途。 相关工作请引用paper: AgriKG: An Agricultural Knowledge Graph and Its Applications[C]. DASFAA (3) 2019: 533-537 项目介绍: 本项目是上海市《农业信息服务平台及农业大数据综合利用研究》子课题《上海农业农村大数据共享服务平台建设和应用》的研究成果。 该课题是由上海市农业委员会信息中心主持,以“致富农民、服务市民、提高行政管理效能”为目标,充分发挥大数据在农业农村发展中的重要功能和巨大潜力,重点建设上海市级农业农村大数据中心,促进信息资源的共建共享和创新应用。 华东师范大学数据科学与工程学院(以下简称华师大数据学院)作为课题主要参与单位以实现智慧
1
从生物医学文献中抽取药物间交互反应信息的实验性研究,赵江,兰曼,第一届药物间交互作用信息抽取竞赛(The first Challenge of Drug-Drug Interaction Extraction)主要任务是从包含药物名的句子(即这些句子已经有��
1
分享教程——动手学关系抽取-知识图谱基础篇,2020年11月录制,知识图谱技术是人工智能技术的重要组成部分,以结构化的方式描述客观世界中的概念、实体及其间的关系。知识图谱技术提供了一种更好的组织、管理和理解互联网海量信息的能力,将互联网的信息表达成更接近于人类认知世界的形式。关系抽取作为知识图谱构建与使用关键技术之一,一直受到众多研发人员追捧。本套课程基于Pytorch1.5版本来实现关系抽取任务,延续动手学系列课程风格,全程手敲代码
2021-09-13 23:50:01 751B 知识图谱 人工智能 pytorch
1
生物医学实体关系抽取是生物医学文本挖掘领域的一项重要任务,它可以自动从生物医学文本中挖掘实 体间的相互关系 目前,生物医学实体关系抽取方法一般只针对某一特定任务(如药物关系,蛋白质交互关系抽取 等)训练单任务模型进行抽取,忽略了多个任务之间的相关性 因此,该文使用基于神经网络的多任务学习方法对 多个生物医学关系抽取任务间的关联性进行了探索 首先构建了全共享模型和私有共享模型,然后在此基础上提 出了一种基于Attention机制的主辅多任务模型 在生物医学领域关系抽取的5个公开数据集上的实验结果表 明,该文的多任务学习方法可以有效地在学习任务之间共享信息,使得任务间互相促进,获得了比单任务方法更好 的关系抽取结果
1
运行该项目的模型训练和模型预测脚本需要准备BERT中文版的模型数据,下载网址为: 。   利用笔者自己收集的3881个样本,对人物关系抽取进行尝试。人物关系共分为14类,如下: { "unknown": 0, "夫妻": 1, "父母": 2, "兄弟姐妹": 3, "上下级": 4, "师生": 5, "好友": 6, "同学": 7, "合作": 8, "同人": 9, "情侣": 10, "祖孙": 11, "同门": 12, "亲戚": 13 }   人物关系类别频数分布条形图如下:   模型结构: BERT + 双向GRU + Attention + FC   模型训练效果: # 训练集(train), loss: 0.0260, acc: 0.9941 # 最终测试集(test), loss: 0.9505, acc:
2021-09-03 20:56:57 690KB Python
1