给大家分享一套课程——自然语言处理NLP企业级项目课程合集课程(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),大家下载学习。
2024-01-02 17:35:20 299B 自然语言处理 课程资源
1
分享自然语言处理课程——自然语言处理NLP企业级项目课程合集(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),视频,源码,数据,课件,资料完整
2023-07-21 10:33:18 287B 自然语言处理 NLP
1
4.1 电子病历实体关系抽取任务 电子病历命名实体关系抽取主要研究从电子病 历中抽取疾病、症状、检查和治疗这几类实体间的 关系. 这些实体关系体现了患者健康状况信息和针 对患者的医疗处置措施, 也体现了医生的专业知识. 如下面的例子: 1) 头 CT 检查显示腔隙性脑梗死 (检查 “头 CT” 证实了疾病 “腔隙性脑梗死”); 2) 患者彩超结果汇报轻度脂肪肝、慢性胆囊炎, 给予饮食指导, 继续治疗方案 (“彩超” 证实了 “轻度 脂肪肝” 和 “慢性胆囊炎”, “饮食指导” 施加于 “轻 度脂肪肝” 和 “慢性胆囊炎”). 电子病历实体关系抽取任务在命名实体识别基 础上展开, 对病历文本中同一个语句中的两个命名 实体赋予预定义的关系类型, 因而该任务转化为分 类问题, 通常采用基于机器学习的方法实现, 评价指 标采用精确度、召回率和 F 值. 目前电子病历实体 关系只限于一个句子范围内两个实体之间的关系. Uzuner 首先对医疗实体关系抽取进行了开创 性的研究, 详细定义了六大类医疗实体关系: 当前疾 病和治疗的关系、可能的疾病和治疗的关系、疾病 (包括当前的和可能的) 和检查的关系、疾病和症状 的关系、当前症状和治疗的关系、可能的症状和治 疗的关系[3]. 如果已经定义了修饰识别任务, 实现了 疾病和症状的修饰识别, 那么在关系抽取时, 可以不 考虑修饰的影响, 直接抽取实体间的关系, 然后借助 实体的修饰, 可以得到文献 [3] 定义的上述各类关 系. 所以, 在 I2B2 2010 评测中, 实体关系的定义没 有考虑修饰的因素. I2B2 2010 首次对电子病历命 名实体关系进行了系统的分类[12], 这些关系包括医 疗问题和医疗问题之间的关系、医疗问题和检查之 间的关系、医疗问题和治疗之间的关系. 这三类关系 以医疗问题为中心, 反映了电子病历面向医疗问题 的信息组织方式. 这三类关系只限于一个句子范围 内两个实体之间的关系. 表 5 详细列出了医疗问题、 检查和治疗这三类实体间的关系. 针对中文电子病历特点, 医疗问题被拆分为疾 病和症状,那么在定义实体关系时,也应作相应调整. 主要体现在两方面: 1) 医疗问题和治疗 (或检查) 的 关系转变为疾病和治疗的关系以及症状与治疗的 关系, 医疗问题和检查的关系也转变为疾病和检查 的关系以及症状和检查的关系; 2) 医疗问题之间的 关系替换为疾病和症状的关系 (疾病导致了症状)、 疾病和疾病的关系 (疾病导致了另一个疾病)、症状 和症状的关系 (症状伴随另一个症状). 自动抽取这几类实体间的关系可以构造患者健 康状况的简明摘要, 医生可以预先快速浏览病人的 信息, 后续再关注特定的细节. 除了可以用作医疗研 表 4 疾病和症状的修饰识别方法总结 Table 4 Summarization of methods for assertion classification 作者 方法 用到的资源 数据 评价 (F 值) Chapman 等[13] (NegEx) 规则 正则表达式规则 出院小结 0.853 Mutalik 等[105] (Negfinder) 规则 正则表达式规则、句法规则 自建语料 0.965 Sohn 等[106] (DepNeg) 规则 依存规则 I2B2 2010 评测数据 0.838 Harkema 等[107] (ConText) 规则 正则表达式规则、触发词 6 种类型的病历文本 0.76∼ 0.93 Uzuner 等[108] SVM / 三个机构的病历 0.35∼ 0.98 Grouin 等[110] SVM NegEx I2B2 2010 评测数据 0.931 Jiang 等[97] SVM MedLEE I2B2 2010 评测数据 0.931 de Bruijn 等[99] SVM cTAKES I2B2 2010 评测数据 0.936 Clark 等[111] CRF、最大熵 语义分类词典、状态规则 I2B2 2010 评测数据 0.934
2023-03-23 11:28:15 979KB EMR 人工智能 智能医疗 电子病历
1
基于BiLSTM实现文本实体关系抽取任务——数据集.zip
2022-12-22 18:31:04 5.2MB 神经网络
实体关系抽取旨在识别网络文本中的实体,并提取出文本中实体之间隐含的关系。研究表明,深度神经网络在实体关系抽取任务上具有可行性,并优于传统关系抽取方法。目前的关系抽取方法大都使用卷积神经网络(CNN)和长短期记忆神经网络(LSTM),然而CNN只考虑连续词之间的相关性而忽略了非连续词之间的相关性。另外,LSTM虽然考虑了长距离词的相关性,但提取特征不够充分。针对这些问题,提出了一种CNN和LSTM结合的实体关系抽取方法,采用3种结合方法进行了实验,验证了该方法的有效性,在F1值上有一定的提升。
1
本文档主要讲解deepdive的使用方法和编程方法,讲解细致,有代码展示。需要的同学可以下载查阅,学习。
1
SemEval2010 任务8 实体关系抽取数据集 已经标注的语料 SemEval2010 任务8 实体关系抽取数据集 已经标注的语料
2022-03-16 08:42:10 1.87MB SemEval2010 任务8 实体关系
1
该方法利用依存句法分析简称依存分析实现开放式中文实体关系抽取,首先对一个句子进行依存分析,再结合中文语法启发式规则和依存分析的结果抽取关系表述,并根据距离确定论元位置,最后进行三元组输出。
2022-03-08 19:51:10 999KB 依存分析 实体关系抽取
1
有三个文件,1.经济方面的实体关系数据集 2.几篇中文实体论文 3.SemEval2010_任务8_实体关系抽取数据集
2022-01-29 14:56:45 18.42MB 实体关系抽取
1
SemEval2010 任务8 实体关系抽取数据集 已经标注的语料 从其他地方整理过来,欢迎下载使用!
2021-11-24 19:23:08 1.87MB SemEval2010_任务8_
1