维基百科英文语料文档out_wiki.en.txt
2022-05-31 12:13:01 282.97MB NLP 语料 维基
1
人民日报语料处理工具集 | Tools for Corpus of People's Daily
2022-05-27 18:05:52 2.53MB Python开发-自然语言处理
1
包括十个类,环境,计算机,交通,教育,经济,军事,体育,医药,艺术,政治
2022-05-21 17:10:32 2.55MB 文本分类语料
1
语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-05-21 16:37:46 51.14MB 语料库 复旦 测试
1
数据集是COAE2015评测中的任务:关于中文情感倾向型分析, 适合用于训练情感分析的模型。比如针对博文:哇塞,这里有好多绝版的照片,简直太赞了! 带有标签信息 positive
2022-05-14 11:19:57 1.97MB 情感倾向性分析  情绪分析 语料
1
自然语言处理第二次作业: data文件夹中存储语料(中文语料以及英文语料由老师提供,另一份为中文停用词语料) output文件夹中存储输出的词向量文件 script文件夹中为CBOW的脚本,同时处理中文语料与英文语料 运行步骤:在脚本中确定训练中文或者是英语后,直接运行即可
2022-05-11 10:42:22 13.58MB nlp pytorch cbow 词向量
1
【doc】一种对BBS语料进行话题提取的聚类算法.doc
2022-05-09 09:06:37 34KB 算法 聚类 文档资料 数据结构
专业的标注工具(名实体识别 模板元素识别) 很实用 很权威
2022-05-05 18:50:54 11.94MB ace tools
1
这个链接是测试集,训练集请见这个链接: 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-04-26 22:51:22 51.14MB 中文文本分类 文本分类语料
1
利用500万条微博语料对微博评论进行情感分析-附件资源
2022-04-25 20:22:43 106B
1