1.2 命名实体识别的研究现状
近年来,命名实体识别的研究逐步升温,国内外的很多会议都关注命名实体
识别的研究。
(1)MUC
MUC(Message Understanding conference)曾推动了上个世纪的自然语言处理的
蓬勃发展。1995 年 9 月举行的 MUC-6 会议首次出现了术语“命名实体”,并引入
了英文命名实体识别的评测任务。在其后的一系列关于自然语言处理的会议中都
有对命名实体识别的研究。
(2)ACE[4]
2000 年 12 月由美国国家标准技术研究所组织的自动内容抽取(Automatic
Content Extraction,ACE)评测会议将实体识别作为它评测的两大任务之一。命名实
体可以看作是 ACE 识别的实体的子集。ACE 识别的实体更像是名词短语,可以嵌
套,类别也更多,同时还需要确定实体间的共指关系,因此难度较大。
(3)863 评测[5]
国家 863 命名实体识别评测小组在 2004 年度命名实体识别评测大纲中,描述
了对命名实体主要任务的定义:“命名实体任务由三个子任务组成(命名实体、时
间表达式、数字表达式)。被标注的表达式为命名实体(组织、人、地点)、时间(日
期、时间)及数量。”
目前,英文命名实体识别方面人们已经展开了大量的研究工作并取得了较满
意的效果。在 MUC-6 评测中,Bikel D 等提出的基于隐马尔科夫夫模型的英文命
2022-01-27 16:23:22
859KB
命名实体识别
1