MSR数据集,是微软公开的相似度计算数据集,其中训练集有4076个句子,其中包含2753个相似度为1,即为正例句子;测试集有1725个句子,其中包含1147个正例句子。
2021-04-26 17:12:27 485KB MSR数据集 文本相似度计算
1