表 5.2 选取的部分搜狗语料库文章类别及数目表 类别 奥运 房产 娱乐 健康 教育 体育 旅游 汽车 商业 时尚 总计 文章 数目 19940 52405 24233 4049 7539 62751 6480 4889 45616 12342 240244 数据处理及特征提取过程与上节类似,这里只介绍不同过程。 在数据预处理阶段,针对本数据集加入了新的无关词表,如图 5.39所示。 图 5.39 自建无关词表示意图 筛选每个类别中的特征词,所有类别内的保留词情况如图 5.40所示。 图 5.40 所有类别内的保留词情况示意图 利用朴素贝叶斯分类方法,2折交叉验证中每次的 classification_report、分类正确率 以及混淆矩阵如图 5.41-图 5.43所示。
2022-06-14 10:41:19 4.05MB 数据挖掘 文本分类
1
主要功能有: 普通用户:在线考试,成绩查询,修改密码; 系统管理员:考生信息管理,考试成绩查询,试卷管理,题目管理;
2022-06-14 08:55:37 27.83MB IDEA JAVA SSH bootstrap
1
用maven开发项目,采用SSM框架,附带MySQL数据库
2022-06-13 15:55:16 234.05MB maven java intellij-idea 开发语言
1
内含有完整的项目工程(idea工程+数据库代码)+项目部署视频+项目讲解视频(搞定答辩)+毕业论文(知网查重率6%)详情请看地址:https://blog.csdn.net/Like_Bamboo/article/details/121191552
2022-06-13 15:30:50 32.63MB MySQL idea jsp ssm
idea加密算法代码,用C语言编写的,大家调试一下把!
2022-06-12 21:46:33 4KB IDEA
1
项目说明:学习版(只供学习使用) 开发工具 :IDEA 2017 数据库:mysql 后端开发框架: Spring MVC + Spring + Mybatis +ModelMapper + logback 前端框架:layui + jquery 说明:项目为多Module 项目结构, IDEA加载项目可直接运行(运行前配置数据库链接字符串)。采用前后端分离已经可以进行添加修改列表显示等操作。
2022-06-12 19:04:46 17.02MB IDEAssmlayui整 ideaVlawv.dol 前后端分离
IDEA是一种由8个相似圈(Round)和一个输出变换(Output Transformation)组成的迭代算法。IDEA的每个圈都由三种函数:模(216+1)乘法、模216加法和按位XOR组成。
2022-06-12 16:58:18 10KB idea 加密
1
汉化包,中文包,直接放到C:\Program Files (x86)\JetBrains\IntelliJ IDEA 15.0.1\lib目录下即可
2022-06-10 15:49:17 13.51MB IDEA15 汉化包
1
在官网上下载太慢了,上传到CSDN,在这里下载,比国外网站要快很多,省了很多时间。
2022-06-10 13:07:57 63.9MB idea插件
1
idea插件---背景播放歌曲
2022-06-09 20:04:50 6KB idea插件---背景播放歌曲
1