搜索【语料】的结果

中文文本分类语料-测试集下载

中文文本分类语料-测试集下载是测试集，训练集请见我的资源本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。

2022-07-21 10:16:29 52.72MB 大数据 文本分析 文本训练 机器学习

1

中英平行语料50000句.rar

语料来源为WMT18，本资源包含中英文的平行语料50000句，以及简单预处理后的文件。中文预处理：去除标点、数字，分词；英文预处理：去除标点、数字，大小写转换。可以用来做简单的神经机器翻译练习使用。

2022-07-06 19:41:24 7.59MB 机器翻译 神经网络 机器学习

1

500万微博语料.7z

2022-06-17 16:03:55 408.3MB 数据集

人民日报1998年1月份的语料

人民日报的1998年1月份的标注过的语料。

2022-06-01 08:47:04 2.12MB 人民日报 语料

1

维基百科英文语料文档out_wiki.en.txt

2022-05-31 12:13:01 282.97MB NLP 语料维基

1

Python-人民日报语料处理工具集ToolsforCorpusofPeoplesDaily

人民日报语料处理工具集 | Tools for Corpus of People's Daily

2022-05-27 18:05:52 2.53MB Python开发-自然语言处理

1

文本分类语料

包括十个类，环境，计算机，交通，教育，经济，军事，体育，医药，艺术，政治

2022-05-21 17:10:32 2.55MB 文本分类语料

1

文本分类语料库（复旦）-测试语料

本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料，共9833篇文档；train_corpus.rar为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。文件较大（训练测试各50多兆），下载时请耐心等待。

2022-05-21 16:37:46 51.14MB 语料库 复旦测试

1

COAE2015_task1.zip

数据集是COAE2015评测中的任务：关于中文情感倾向型分析，适合用于训练情感分析的模型。比如针对博文：哇塞，这里有好多绝版的照片，简直太赞了！带有标签信息 positive

2022-05-14 11:19:57 1.97MB 情感倾向性分析 情绪分析 语料

1

中英文语料训练CBOW模型获得词向量（pytorch实现）

自然语言处理第二次作业： data文件夹中存储语料（中文语料以及英文语料由老师提供，另一份为中文停用词语料） output文件夹中存储输出的词向量文件 script文件夹中为CBOW的脚本，同时处理中文语料与英文语料运行步骤：在脚本中确定训练中文或者是英语后，直接运行即可

2022-05-11 10:42:22 13.58MB nlp pytorch cbow 词向量

1

个人信息

热门下载

最新下载

其他资源