给大家分享一套课程——自然语言处理NLP企业级项目课程合集课程(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),大家下载学习。
2024-01-02 17:35:20 299B 自然语言处理 课程资源
1
EER 扩展的实体关系模型 我从豆丁网上截图作成的。。。累
2023-11-13 10:27:50 3.44MB 扩展的实体关系模型
1
分享自然语言处理课程——自然语言处理NLP企业级项目课程合集(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),视频,源码,数据,课件,资料完整
2023-07-21 10:33:18 287B 自然语言处理 NLP
1
4.1 电子病历实体关系抽取任务 电子病历命名实体关系抽取主要研究从电子病 历中抽取疾病、症状、检查和治疗这几类实体间的 关系. 这些实体关系体现了患者健康状况信息和针 对患者的医疗处置措施, 也体现了医生的专业知识. 如下面的例子: 1) 头 CT 检查显示腔隙性脑梗死 (检查 “头 CT” 证实了疾病 “腔隙性脑梗死”); 2) 患者彩超结果汇报轻度脂肪肝、慢性胆囊炎, 给予饮食指导, 继续治疗方案 (“彩超” 证实了 “轻度 脂肪肝” 和 “慢性胆囊炎”, “饮食指导” 施加于 “轻 度脂肪肝” 和 “慢性胆囊炎”). 电子病历实体关系抽取任务在命名实体识别基 础上展开, 对病历文本中同一个语句中的两个命名 实体赋予预定义的关系类型, 因而该任务转化为分 类问题, 通常采用基于机器学习的方法实现, 评价指 标采用精确度、召回率和 F 值. 目前电子病历实体 关系只限于一个句子范围内两个实体之间的关系. Uzuner 首先对医疗实体关系抽取进行了开创 性的研究, 详细定义了六大类医疗实体关系: 当前疾 病和治疗的关系、可能的疾病和治疗的关系、疾病 (包括当前的和可能的) 和检查的关系、疾病和症状 的关系、当前症状和治疗的关系、可能的症状和治 疗的关系[3]. 如果已经定义了修饰识别任务, 实现了 疾病和症状的修饰识别, 那么在关系抽取时, 可以不 考虑修饰的影响, 直接抽取实体间的关系, 然后借助 实体的修饰, 可以得到文献 [3] 定义的上述各类关 系. 所以, 在 I2B2 2010 评测中, 实体关系的定义没 有考虑修饰的因素. I2B2 2010 首次对电子病历命 名实体关系进行了系统的分类[12], 这些关系包括医 疗问题和医疗问题之间的关系、医疗问题和检查之 间的关系、医疗问题和治疗之间的关系. 这三类关系 以医疗问题为中心, 反映了电子病历面向医疗问题 的信息组织方式. 这三类关系只限于一个句子范围 内两个实体之间的关系. 表 5 详细列出了医疗问题、 检查和治疗这三类实体间的关系. 针对中文电子病历特点, 医疗问题被拆分为疾 病和症状,那么在定义实体关系时,也应作相应调整. 主要体现在两方面: 1) 医疗问题和治疗 (或检查) 的 关系转变为疾病和治疗的关系以及症状与治疗的 关系, 医疗问题和检查的关系也转变为疾病和检查 的关系以及症状和检查的关系; 2) 医疗问题之间的 关系替换为疾病和症状的关系 (疾病导致了症状)、 疾病和疾病的关系 (疾病导致了另一个疾病)、症状 和症状的关系 (症状伴随另一个症状). 自动抽取这几类实体间的关系可以构造患者健 康状况的简明摘要, 医生可以预先快速浏览病人的 信息, 后续再关注特定的细节. 除了可以用作医疗研 表 4 疾病和症状的修饰识别方法总结 Table 4 Summarization of methods for assertion classification 作者 方法 用到的资源 数据 评价 (F 值) Chapman 等[13] (NegEx) 规则 正则表达式规则 出院小结 0.853 Mutalik 等[105] (Negfinder) 规则 正则表达式规则、句法规则 自建语料 0.965 Sohn 等[106] (DepNeg) 规则 依存规则 I2B2 2010 评测数据 0.838 Harkema 等[107] (ConText) 规则 正则表达式规则、触发词 6 种类型的病历文本 0.76∼ 0.93 Uzuner 等[108] SVM / 三个机构的病历 0.35∼ 0.98 Grouin 等[110] SVM NegEx I2B2 2010 评测数据 0.931 Jiang 等[97] SVM MedLEE I2B2 2010 评测数据 0.931 de Bruijn 等[99] SVM cTAKES I2B2 2010 评测数据 0.936 Clark 等[111] CRF、最大熵 语义分类词典、状态规则 I2B2 2010 评测数据 0.934
2023-03-23 11:28:15 979KB EMR 人工智能 智能医疗 电子病历
1
关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采用单层注意力机制,特征表达相对单一.因此本文在已有研究基础上,引入多头注意力机制(Multi-head attention),旨在让模型从不同表示空间上获取关于句子更多层面的信息,提高模型的特征表达能力.同时在现有的词向量和位置向量作为网络输入的基础上,进一步引入依存句法特征和相对核心谓词依赖特征,其中依存句法特征包括当前词的依存关系值和所依赖的父节点位置,从而使模型进一步获取更多的文本句法信息.在SemEval-2010任务8数据集上的实验结果证明,该方法相较之前的深度学习模型,性能有进一步提高.
2023-02-27 17:05:50 981KB 关系分类 Bi-LSTM 句法特征 self-attention
1
模拟文件系统,操作系统课程设计的心血,含详细设计报告设计要求·设计思想·数据结构设计·实体关系图·数.rar
2023-01-16 13:23:50 136KB 模拟文件系统
1
基于BiLSTM实现文本实体关系抽取任务——数据集.zip
2022-12-22 18:31:04 5.2MB 神经网络
这是一款实体关系联合标注的本地小程序,以Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用Python编程实现可视化界面和主要功能.
2022-10-31 21:05:00 334KB 知识图谱 标注工具 python3
1
CCKS 2019 举办了 一个包含 6 个任务的评测竞赛,覆盖了实体、关系、事件及问答等多类知识图谱关键技术,吸引了 1600 余支队伍参 加。本报告系统整理了参赛队伍使用的技术、资源和策略,可以为评估当前知识图谱技术水平,提供构建知识图谱系 统的技术参考,揭示未来的发展方向提供一份有价值的参考。
2022-09-13 15:49:52 993KB CCKS_2019
1
ACE2005语料库是语言数据联盟(LDC)发布的由实体,关系和事件注释组成的各种类型的数据,包括英语,阿拉伯语和中文培训数据,目标是开发自动内容提取技术,支持以文本形式自动处理人类语言。 ACE语料解决了五个子任务的识别:entities、values、temporal expressions、relations and events。这些任务要求系统处理文档中的语言数据,然后为每个文档输出有关其中提到或讨论的实体,值,时间表达式,关系和事件的信息。 ACE2005数据集是收费的,可在LDC联盟的官网上进行购买
2022-08-18 21:38:16 531KB ACE数据集
1