paws:该数据集包含108,463个人标签和656k带有噪音标签的对,其特征在于建模结构,上下文和单词顺序信息对于复述识别问题的重要性-源码

上传者: 42139357 | 上传时间: 2021-08-19 12:11:36 | 文件大小: 9KB | 文件类型: ZIP
PAWS:单词加扰的释义对手 ***** 2019年8月27日新版:六种语言的多语言PAWS ***** 我们发布了PAWS-X,这是PAWS的多语言版本,支持六种语言。 有关更多详细信息,请参见。 *****结束新信息***** 该数据集包含108,463个人标签和656k噪音标签对,这些特征对建模含义,上下文和单词顺序信息对于复述识别问题的重要性具有重要意义。 该数据集有两个子集,一个子集基于Wikipedia,另一个子集基于 (QQP)数据集。 有关更多详细信息,请参见随附的论文: 动机 现有的复述识别数据集缺少具有高词法重叠而不是复述的句子对。 经过此类数据训练的模型无法区分从纽约到佛罗里达的航班和从佛罗里达到纽约的航班。 以下是数据集中的两个示例: 句子1 句子2 标签 (1) 尽管可以互换,但两辆车上的车身零件并不相似。 尽管相似,但两辆车的车身零件不可互换

文件下载

资源详情

[{"title":"( 5 个子文件 9KB ) paws:该数据集包含108,463个人标签和656k带有噪音标签的对,其特征在于建模结构,上下文和单词顺序信息对于复述识别问题的重要性-源码","children":[{"title":"paws-master","children":[{"title":"LICENSE <span style='color:#111;'> 320B </span>","children":null,"spread":false},{"title":"qqp_generate_data.py <span style='color:#111;'> 4.98KB </span>","children":null,"spread":false},{"title":"wiki_raw_and_mapping","children":[{"title":"README.md <span style='color:#111;'> 2.21KB </span>","children":null,"spread":false}],"spread":true},{"title":"README.md <span style='color:#111;'> 7.19KB </span>","children":null,"spread":false},{"title":"pawsx","children":[{"title":"README.md <span style='color:#111;'> 4.93KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明