我们提供NYT数据集,该数据集一共包含233081实体对,由FreeBase对齐,关系数量为57(如果使用53关系的可自行过滤多余的关系及句子)。
2021-08-23 22:31:11 72.68MB 远程监督关系抽取 distant supervis NLP
1
BRCNN-Relation-Extraction.pdf
2021-08-20 09:14:31 1.08MB 知识图谱
该PPT为阅读Neural Relation Extraction with Selective Attention over Instances论文后所做的笔记,总结了论文中的主要技术,并大致梳理了论文思路
2021-07-14 17:21:56 800KB Attention Relation Extraction
1
baseline feature.py 抽取特征 corpora corpus1.txt 远程监督标注语料 sents.txt 还原的标注句子 sents_with_pos.txt 标注格式变换 dict 字典 数值化转换 entities.dict 实体字典 nes.dict 实体标记字典 postags.dict 词性标记字典 rels.dict 关系字典 libsvm-3.22 svm算法实现工具 result 结果 feature2libsvm.csv 符合libsvm格式的输入文件 features.pickle 抽取特征的结果 features.vec.csv 特征数值化后的结果 grid.out 参数优化结果 grid.png 参数优化结果 model.txt 模型 test.vec 测试语料集 test_vec.scale 数值缩放后测试语料集 train.vec 训练语料
1
本文回顾了现有的RE方法,分析了当前面临的关键挑战,为更强大的RE指明了希望的方向,希望我们的观点能够推动这一领域的发展,激励社会做出更大的努力。
2021-06-21 14:58:14 6.93MB OpenRE
1
ruijin_round2:瑞金医院MMC人工智能辅助建立知识图谱大赛复赛
1
ChineseNRE 本项目使用 python 2.7 pytorch 0.4.0 中文实体关系抽取,对实体关系抽取不了解的可以先看。顺便求star~ 数据 中文实体关系抽取数据实在太难找了,data中是忘记在哪里找的人物关系数据集,一共11+1种关系,数据质量不太好,但也找不到其他的了。 (更新)中 ybNero 同学分享了一份数据集,大家可以去issues中查看~ 梅葆玥 梅兰芳 父母 坎坷经历梅葆玥之家庭合影1961年,梅兰芳先生病逝,葆玥、葆玖姐弟俩继承父亲的遗志,挑起了梅剧团的重担 数据格式为: 实体1 实体2 关系 句子。 虽然叫中文实体关系抽取,还是增加了一个英文数据集SemEval2010_task8,简单做了下数据处理,这是免费的公开数据集,其他的好像都要dollar了。。 训练 模型使用的是lstm+attention模型。特征使用词向量+位置向量。 训练前先运行dat
2021-05-19 16:14:00 23.37MB pytorch chinese attention relation-extraction
1
Graph-based reasoning model for multiple relation extraction.pdf
2021-03-02 14:02:46 662KB 知识图谱
1