ChineseNRE
本项目使用
python 2.7
pytorch 0.4.0
中文实体关系抽取,对实体关系抽取不了解的可以先看。顺便求star~
数据
中文实体关系抽取数据实在太难找了,data中是忘记在哪里找的人物关系数据集,一共11+1种关系,数据质量不太好,但也找不到其他的了。 (更新)中 ybNero 同学分享了一份数据集,大家可以去issues中查看~
梅葆玥 梅兰芳 父母 坎坷经历梅葆玥之家庭合影1961年,梅兰芳先生病逝,葆玥、葆玖姐弟俩继承父亲的遗志,挑起了梅剧团的重担
数据格式为: 实体1 实体2 关系 句子。
虽然叫中文实体关系抽取,还是增加了一个英文数据集SemEval2010_task8,简单做了下数据处理,这是免费的公开数据集,其他的好像都要dollar了。。
训练
模型使用的是lstm+attention模型。特征使用词向量+位置向量。
训练前先运行dat
1