从各个网站上爬取的政治新闻,包括新浪网,凤凰网,环球网以及中华网!
2021-11-29 18:45:11 54.21MB 新闻语料
1
用于深度学习NLP分词训练,训练模式BEMS,已经标注好,可直接使用
2021-11-27 22:12:23 12.71MB 自然语言处理 深度学习
1
分类_分词@12大类5485文本1127万_搜狗.20151022 各种词库 用语分词、词性标注等自然语言处理NLP任务
2021-11-27 20:55:30 8.24MB 词典 分词 语料
1
NLP民工的乐园 最强大的NLP武器库 NLP民工的乐园:几乎最全的中文NLP资源库 词库 工具包 学习资料 在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。 很多包非常有趣,值得收藏,满足大家的收集癖!如果觉得有用,请分享并star,谢谢! 长期不定时更新,欢迎手表和叉子! 涉及内容包括但不限于:中英文敏感词,语言检测,中外手机/电话归属​​地/运营商查询,名字,名称,性别,手机号撤回,身份证删除,邮箱删除,中日文人名库,中文缩写库,拆字字典,词汇情感值,替换词,反动词表,暴恐词表,繁简体转换,英文模拟中文最佳,汪峰歌词生成器,职业名称词库,词典库,反义词库,否定词库,汽车品牌词库,汽车零件词库,连续英语切割,各种中文词向量,公司名称大全,古诗词库,IT词库,财经词库,成语词库,地名库,历史名人词库,诗词词库,医学词库,饮食词库,法律词库,汽车词库,动
2021-11-25 15:48:32 69.21MB Python
1
NLP自然语言处理相关数据集
2021-11-22 16:07:19 399.11MB NLP 数据集 语料
1
文本训练语料集.rar
2021-11-21 13:07:13 3.19MB 文本训练语料集 IT
1
系统Ubuntu对话数据集下载地址 ubuntu对话系统数据集 Ubuntu对话数据集,可以用于多轮对话训练语料库,内附Ubuntu对话数据集的下载地址。智能聊天,chatbot,训练对话的语料
1
人民日报分词语料1998年1月份,包含训练和两份语料和汇总语料,可以自行训练和验证模型使用。
2021-11-19 10:16:49 5.27MB 人民日报语料
1
使用nltk处理中文语料(1)- 统计相关-附件资源
2021-11-18 22:33:25 106B
1
知网期刊公开的文艺、计算机、体育类文章,用于文本分类学习研究
2021-11-17 09:04:05 16.3MB 文本分类语料
1