随着医疗信息化的发展,医院产生了大量的医疗数据信息,积累了庞大的医疗电子病历数据。电子病历(EMR)是具有非结构化句子和多种概念表达,为医学信息提取提供了丰富的信息。然而,庞大的数据信息严重影响处理效率,因此提取电子病历中的命名实体成为研究的热点问题。为提高医院对复杂数据的处理效率,减轻工作人员的压力,本文提出了一种基于条件随机场(CRF)模型和特征模板结合的算法,来识别中文电子病历中的命名实体单元,识别准确率可以达到92.9%,可以有效地识别电子病历命名实体。基于本文采用的方法可以来结构化电子病历,减轻医生负担,推动医疗领域的发展。
1