已处理过的干净中英平行语料,无乱码空值杂质,其中还夹杂了其他场景的数据,一共30w,新手上手机器翻译时可以拿来练手,测试模型,免去了数据清洗的大量工作
2023-03-08 12:04:39 27.33MB 数据 平行语料 中英
1
Datasets for Training Chatbot System 收集了一些从网络中找到的用于训练中文(英文)聊天机器人的对话语料 公开语料 搜集到的一些数据集如下,点击链接可以进入原始地址 dgk_shooter_min.conv.zip 中文电影对白语料
2023-03-07 09:47:41 39.35MB 语料 聊天机器人
1
零售商品分词或数据分析的语料库,如商品品牌
2023-02-16 15:05:29 37KB 语料 分词 商品分词库
1
中英双语语料 59W。一部分,互联网收集与整理,数据已去重!
2023-01-03 17:50:44 166.71MB 中英对照 语料 双语语料
1
知网Hownet情感词典适合做情感词训练,包括主张词 正面情感词、程度级别词、负面情感词 知网Hownet情感词典适合做情感词训练,包括主张词 正面情感词、程度级别词、负面情感词 知网Hownet情感词典适合做情感词训练,包括主张词 正面情感词、程度级别词、负面情感词
2022-12-10 04:33:45 95KB 自然语言 训练语料
1
自然语言处理、 文本挖掘、 数据格式 TEXT 数据介绍 为了弥补国内在中文情感挖掘方面的语料的匮乏 谭松波 收集整理了一个较大规模的酒店评论语料
2022-12-09 11:44:14 775KB nlp 机器学习
1
从完全生语料中提取生成树,该算法用于模式训练,利用信息统计的手段解决传统规则学习的一种有价值的探索。
2022-12-09 10:22:28 6.55MB ADIOS 模板 机器学习
1
负面评价词语(英文).txt 负面评价词语(中文).txt 负面情感词语(英文).txt 负面情感词语(中文).txt 程度级别词语(英文).txt 程度级别词语(中文).txt 正面评价词语(英文).txt 正面评价词语(中文).txt 正面情感词语(英文).txt 正面情感词语(中文).txt 主张词语(英文).txt 主张词语(中文).txt
2022-11-28 15:16:47 82KB 语料 情感 中英文
1
搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。 搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。
2022-11-20 19:33:24 9.49MB 机器学习
1