train.src (训练集的输入(短文本)) train.tgt (训练集的输出(摘要)) test.src (测试集的输入(短文本)) test.tgt (测试集的输出(摘要)) vaild.src (验证集的输入(短文本)) vaild.tgt (验证集的输出(摘要))
2023-02-28 22:34:46 230.78MB nlp
1
自然语言处理的子任务命名实体识别中文的数据集,很全
2023-02-25 17:23:59 148KB Resume NER中文数据集
1
内容、格式如下 0,标准间太差房间还不如3星的而且设施非常陈旧.建议酒店把老的标准间从新改善. 1,这个价格,算性价比很高的一个酒店了。当然价格便宜,就不能太计较服务了。总的来说是一个愿意再次入住的酒店。
2022-11-30 12:28:52 2.22MB 酒店评论数据 中文 数据集
1
基于Pytorch实现的EcapaTdnn声纹识别,训练中文数据集,这个模型使用的是spectrogram 源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-Pytorch/tree/develop
2022-11-25 12:26:52 25.91MB Pytorch EcapaTdnn 声纹识别 spectrogram
基于PaddlePaddle实现的EcapaTdnn声纹识别,训练中文数据集,这个模型使用的是预处理是fbank 源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-PaddlePaddle/tree/develop
2022-11-17 19:27:17 24.2MB PaddlePaddle EcapaTdnn 声纹识别 fbank
基于Pytorch实现的EcapaTdnn声纹识别,训练中文数据集,这个模型使用的是fbank预处理方法。 源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-Pytorch/tree/develop
2022-11-17 19:27:13 24.31MB fbank Pytorch EcapaTdnn 声纹识别
基于PaddlePaddle实现的EcapaTdnn声纹识别,训练中文数据集,这个模型使用的是spectrogram 源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-PaddlePaddle/tree/develop
2022-11-11 16:31:03 25.8MB PaddlePaddle EcapaTdnn 中文数据集 声纹识别
英文打分数据集STS-B的部分中文翻译
2022-11-02 22:13:50 339KB nlp
1
Multi-CPR_ 大规模段落检索多领域中文数据集.zip
2022-06-29 09:06:34 239.18MB 数据集
该文档为ccks2019(全国语义计算与知识图谱大会)自动问答评测任务的语料集,包含训练集开发集和测试集,该问答评测基于PKUbase知识库。 该数据集由北京大学团队发布,github有官方下载地址https://github.com/pkumod/CKBQA,由于github经常速度很慢,因此发布在此便于感兴趣的同学下载
2022-02-16 15:20:09 255KB KBQA 自然语言处理 中文数据集
1