瑞金医院MMC人工智能辅助内置知识图谱大赛(第一赛季) :warning:由于可能存在的版权问题,请自行联系大赛主办方索要数据,在问题中索要数据的请求将不再回复,谢谢! :light_bulb: github对.ipynb渲染效果不是很好,代码建议通过查看。 复赛代码见 背景 本次大赛逐步通过糖尿病相关的教科书,研究论文来做糖尿病文献挖掘和发展糖尿病知识图谱。 初赛赛题在学术论文和临床指南的基础上,做实体的标注。实体类别共十五类。 类别名称和实体定义: 实体类型 标注名称 说明 疾病名称 疾病 如I型糖尿病 病因 原因 疾病的成因,危险因素及机制。某些“糖尿病是由于糖尿病抵抗导致”,胰岛素抵抗是属于病因 临床表现 症状 包
1
实体关系提取 基于TensorFlow的实体和关系提取。基于TensorFlow的实体和关系撤消,2019语言与智能技术竞赛信息撤除(实体与关系撤回)任务解决方案。 如果您对信息抽取论文研究感兴趣,可以查看我的博客。 抽象 该代码以管道式的方式处理实体及关系抽取任务,首先使用一个多标签分类模型判断句子的关系种类,然后将句子和可能的关系类型输入序列标注模型中,序列标注模型标注出句子中的实体,最终结合预测的关系和实体输出实体-关系列表:(实体1,关系,实体2)。 该代码以管道方式处理实体和关系提取任务。 首先,使用多标签分类模型来判断句子的关系类型。 然后,将句子和可能的关系类型输入到序列标签模
1