利用500万条微博语料对微博评论进行情感分析-附件资源
2021-04-01 17:15:56 23B
1
最大逆向匹配的中文分词(附人民日报语料),并计算了准确率与召回率
2021-03-31 14:41:24 32.93MB 分词 逆向 人民日报
1
广告营销类,文本语料,人工收集标注出广告类文本和非广告类文本,可直接跑lgb等二分类模型,对于识别一些广告营销类文本的模型训练,是个不错的语料
2021-03-24 18:00:50 37.08MB 分类模型 文本语料 模型训练集
1
自然语言处理系列:中文维基语料词向量训练PPT
2021-03-22 15:13:19 162KB 自然语言处理
1
中文分词及词性标注语料,包含微软亚研院、搜狗、北京大学等的语料
2021-03-16 21:33:48 40.61MB 中文分词 词性标注 语料
1
2006年,微软亚洲研究院(Microsoft Research Asia, MSRA)发布的BIO格式标注语料,共计46365条。
2021-03-16 17:15:04 6.53MB NLP 语料 NER
1
复旦大学中文文本分类语料.xlsx
2021-03-16 15:24:30 50.67MB 语料 NLP
1
人民日报1953年语料
2021-03-15 18:10:49 17.8MB 人民日报 爬虫 数据库
1
包含体育、游戏等10个类别,共60000多条数据 格式:标签\t文本语料
2021-03-07 19:02:17 66.13MB 文本分类 新闻语料
1
中文词汇分类搜狗语料训练结果
2021-03-06 09:00:11 108KB python
1