运行该项目的模型训练和模型预测脚本需要准备BERT中文版的模型数据,下载网址为: 。
利用笔者自己收集的3881个样本,对人物关系抽取进行尝试。人物关系共分为14类,如下:
{
"unknown": 0,
"夫妻": 1,
"父母": 2,
"兄弟姐妹": 3,
"上下级": 4,
"师生": 5,
"好友": 6,
"同学": 7,
"合作": 8,
"同人": 9,
"情侣": 10,
"祖孙": 11,
"同门": 12,
"亲戚": 13
}
人物关系类别频数分布条形图如下:
模型结构: BERT + 双向GRU + Attention + FC
模型训练效果:
# 训练集(train), loss: 0.0260, acc: 0.9941
# 最终测试集(test), loss: 0.9505, acc:
2021-09-03 20:56:57
690KB
Python
1