BOTSALLY® 赛莉®中文语料自动标注 更新了几个新的功能模块,包含数据转换,事件标注等。标准事件8大类35小类,严格按照ACE2005的标准定义设计。更多语料请关注 赛莉中文语料自动标注平台。
1
如何利用工具进行快速标注是所有人的愿望,赛莉自动标注系统可以自动完成大部分的工作,这是我们的事件抽取展示文档。我们做了标准语料 事件抽取标签展示 无版权 不做商业用途 ,更多语料,欢迎关注 https://www.botsally.tech BOTSALLY® 赛莉®中文语料自动标注系统 语料持续更新
2021-09-16 16:25:35 7KB 事件抽取 NLP 自动标注 语料
1
词性标注按照国家语委词性标注集,编码为utf-8,未进行分句。
2021-09-13 07:32:17 9.49MB 词性标注 国家语委
1
中文分词及词性标注语料,包含微软亚研院、搜狗、北京大学等的语料库
2021-03-16 21:33:48 40.61MB 中文分词 词性标注 语料
1
该数据是完整的BIO标注语料,可用于深度学习机器学习模型训练,分为训练集、测试集以及验证集。
2020-10-25 18:37:48 1.82MB BIO标注 深度学习 训练预料
1
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
2019-12-21 22:05:48 10.18MB 中文语料 标注语料 自然语言处理
1
用与crf分词,标注训练语料。 nlpcc2015任务一的数据
2015-09-16 00:00:00 10.17MB 分词标注语料
1