CEC-Automatic-Annotation:基于CEC语料库挖掘要素识别规则,对新闻报道类生语料进行自动标注

上传者: 42131705 | 上传时间: 2022-11-04 21:14:59 | 文件大小: 7.67MB | 文件类型: ZIP
本项目是基于上海大学语义智能实验室刘宗田教授、刘炜研究员及各硕士博士研究生所共同构建的中文突发事件语料库CEC-(Chinese Emergency Corpus),针对已标注的语料库中,采用LTP进行分词、词性标注、命名实体识别与依存句法分析等;对事件的要素进行规则挖掘,包括词性规则、命名实体规则、依存关系规则等。进而实现对突发事件类新闻报道的生语料进行自动化标注,添加对应的标签,并进行格式校验,存储为XML文件等。 开发环境(测试环境为Windows,不保证支持Unix/Linux环境) Licence:Apache Licence Version2 Version:1.0.0 项目编码设定:UTF-8 开发工具:Eclipse 4.4 luna 操作系统OS:Windows7 64bit JDK version:Oracle JDK 1.8+ 64bit 日志:log4j2.0 单元

文件下载

资源详情

[{"title":"( 108 个子文件 7.67MB ) CEC-Automatic-Annotation:基于CEC语料库挖掘要素识别规则,对新闻报道类生语料进行自动标注","children":[{"title":"log4j2.xml <span style='color:#111;'> 1.13KB </span>","children":null,"spread":false},{"title":"config.properties <span style='color:#111;'> 984B </span>","children":null,"spread":false},{"title":"water.png <span style='color:#111;'> 16.46KB </span>","children":null,"spread":false},{"title":"icon.png <span style='color:#111;'> 6.21KB </span>","children":null,"spread":false},{"title":"annotation.png <span style='color:#111;'> 3.88KB </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明