baidu_nlp_project2
开课吧&后厂理工学院百度NLP项目2:百度试题数据集多标签文本分类
1.数据说明
原始数据集为高中下地理,历史,生物,政治四门学科数据,每个学科下各包含第一层知识点,如历史下分为近代史,现代史,古代史。原始数据示例:
[翻译]率先实行包产到组,包产到户的农业生产责任制的省份是() ①四川②广东③安徽④湖北A。 ①③B。 ①④C。 ②④D。 ②③题型:单选题|缺点:简单|使用次数:0 |纠错复制收藏到空间加入选题篮查看答案解析:A解析:本题主要考察的是对知识的识记能力,比较容易。根据所学知识可知,在四川和安徽,率先实行包产到组,包产到户的农业生产责任制,故①③正确;②④不是。所以答案选A。知识点: [知识点:]经济体制改革,中国的振兴
对数据处理:
将数据的[知识点:]作为数据的第四层标签,显然不同数据的第四层标签数量众多
仅保留翻译作为数据特征,删除
2022-03-09 22:59:02
20KB
Python
1