面向大数据的规则引擎驱动下信息分类方法.pdf
2021-07-04 17:02:46 4.1MB 大数据 数据分析 数据应用 数据时代
利用支持向量机对于微博爬取的不实信息进行分类,并且爬取正常的微博信息,判断微博是否不实。其中正常微博为0,不实微博为1
2021-04-29 15:48:04 5KB 机器学习
1
内容是打包好的信息分类网站源码,满足可搜索可注册需求,图片改成自己公司的。解压后,用IIS部署就可以了
2021-03-15 10:28:03 2.68MB 网站源码 ICP证书 通用信息分类网站
1
本标准按照GB/T 1.1-2009给出的规则起草。 本标准由国家发改委提出并归口。 本标准规定了公共信用信息分类的原则、分类体系架构、编码规则以及分类与代码。 本标准适用于公共信用信息的分类工作。
2021-02-28 09:01:29 559KB 编码规范 政务 公共信息
1
最新版同城信息分类门户小程序源码,亲测无功能障碍(需要准备一个认证过的服务号和小程序号),功能齐全:分类信息、商家入驻、二手资源、交友、便民信息、房产、旅游、养老、分销商城等功能一应俱全
基于贝叶斯分类的中文垃圾信息分类识别核心核心代码,可直接运行的源程序。public void loadTrainingDataChinies(File trainingDataFile,String infoType) { //加载中文分词其 NLPIR.init("lib"); // System.out.println(trainingDataFile.isFile()+"=============="); // 尝试加载学习数据文件 try { // 针对学习数据文件构建缓存的字符流,利用其可以采用行的方式读取学习数据 BufferedReader fileReader = new BufferedReader(new FileReader( trainingDataFile)); // 定义按照行的方式读取学习数据的临时变量 String data = ""; // 循环读取学习文件中的数据 while ((data = fileReader.readLine()) != null) { // System.out.println("*****************************"); //System.out.println(data+"000000000000000000000"); // 按照格式分割字符串,将会分割成两部分,第一部分为ham或spam,用于说明本行数据是有效消息还是垃圾消息,第二部分为消息体本身 //String[] datas = data.split(":"); // 对消息体本身进行简单分词(本学习数据均为英文数据,因此可以利用空格进行自然分词,但是直接用空格分割还是有些简单粗暴,因为没有处理标点符号,大家可以对其进行扩展,先用正则表达式处理标点符号后再进行分词,也可以扩展加入中文的分词功能) //首先进行中文分词 // System.out.println(datas[1]+"------------------------"); //if(datas.length>1) { //System.out.println(datas.length); String temp=NLPIR.paragraphProcess(data, 0); //System.out.println(temp); String[] words = temp.split(" ");
2019-12-21 19:45:49 14KB 垃圾信息 文本分类 贝叶斯
1
JT/414-2006道路运输电子政务平台 信息分类与指标 扫描版本
2019-12-21 19:43:55 2.15MB JT/T414
1
GB_T 2261.1-2003个人基本信息分类与代码 第1部分_ 人的性别代码
2013-02-27 00:00:00 77KB 人的性别代码
1