用于中文命名实体识别的简单BiLSTM-CRF模型
该存储库包含用于为中文命名实体识别任务构建非常简单的基于字符的BiLSTM-CRF序列标签模型的代码。 其目标是识别三种类型的命名实体:PERSON,LOCATION和ORGANIZATION。
这段代码可在Python 3和TensorFlow 1.2上运行,以下存储库给了我很多帮助。
模型
此模型类似于论文[1]和[2]提供的模型。 其结构如下图所示:
对于一个中文句子,该句子中的每个字符都有/将具有属于{O,B-PER,I-PER,B-LOC,I-LOC,B-ORG,I-ORG}集的标记。
第一层是查找层,旨在将每个字符表示从一个
1