我们提供NYT数据集,该数据集一共包含233081实体对,由FreeBase对齐,关系数量为57(如果使用53关系的可自行过滤多余的关系及句子)。
2021-08-23 22:31:11 72.68MB 远程监督关系抽取 distant supervis NLP
1
baseline feature.py 抽取特征 corpora corpus1.txt 远程监督标注语料 sents.txt 还原的标注句子 sents_with_pos.txt 标注格式变换 dict 字典 数值化转换 entities.dict 实体字典 nes.dict 实体标记字典 postags.dict 词性标记字典 rels.dict 关系字典 libsvm-3.22 svm算法实现工具 result 结果 feature2libsvm.csv 符合libsvm格式的输入文件 features.pickle 抽取特征的结果 features.vec.csv 特征数值化后的结果 grid.out 参数优化结果 grid.png 参数优化结果 model.txt 模型 test.vec 测试语料集 test_vec.scale 数值缩放后测试语料集 train.vec 训练语料
1