屏蔽字 敏感词 包括屏蔽的各种敏感网址,各种不被游戏通过的敏感词
2019-12-21 20:16:22 248KB 屏蔽字 敏感词
1
该算法基于DFA并结合许多算法并进行相应的简化,最终其算法基本原理为:将所有敏感词库按模块聚合构建成一个词树(所谓聚合,就是将相同字开头的部分进行聚合,以减少对词的查询范围,相当于建立敏感词索引,如:他奶奶的、他妈的、他娘的,这三个词,聚合构建成词树时,“他”字就是这三个词的索引,同时每个词的结尾都有一个结束标志和该词的一些描述,如敏感级别等),然后从头到尾扫描一遍目标文本,当遇到以敏感词树中的索引的字时,查看后面的文本是否构成敏感词(如果这里有以这个敏感词开头的更长的敏感词时,以更长的为匹配结果,并判断该词在文本中前后是否有分隔符来区别其匹配方式),如果是则记录,一遍扫描完之后所有敏感词即被扫描出来了!
2019-12-21 20:09:48 112KB 敏感词过滤
1
通过各种渠道收集的敏感词,可用于构建敏感词库、自然语言处理污词发现的对比语料;详细不重复。
2019-12-21 19:57:27 537KB 敏感词
1
词库+网站敏感词词库 包含: 网站违禁词库.txt 约10w CiKu4.txt 约180w
2019-12-21 19:57:06 11.36MB 词库
1
已在项目中使用,绝对是你想要的,PHP实现的敏感词过滤功能。6000多个敏感词,可自行添加。使用方便,代码含注释!
2019-12-21 19:56:27 33KB php敏感词
1
此系统推荐给初级java学习者,本系统可统计英文文章中敏感词出现的次数,敏感词存在统一或不同txt文件中,并加入了单词查询功能,可以在查询窗口中输入单个单词,系统会查询后给出出现次数及出现位置
2019-12-21 19:49:29 185KB java 敏感词统计
1
基于简单的java基础,制作的java敏感词程序,可用于学生提交作业
2019-12-21 19:48:25 25KB 敏感词
1
WM算法实现_敏感词过滤,java版本 敏感词库为XML格式
2019-12-21 19:46:55 5KB WM算法 敏感词 过滤
1
用C++写的比较简单的敏感词过滤程序,涉及到几个简单的算法和一些容器使用
2019-12-21 19:46:01 2KB 敏感词过滤 C++ 简单
1
1、匹配大小写过滤 2、匹配全角半角过滤 3、匹配过滤停顿词过滤。 例如: 解析问题: 你是逗比吗? 解析字数 : 33 加载时间 : 325928565ns 加载时间 : 325ms 解析时间 : 330260250ns 解析时间 : 330ms 你是逗比吗?****!****,你竟然用***,********* 是否包含敏感词: true 解析时间 : 149028ns 解析时间 : 0ms
2019-12-21 19:44:09 14KB 敏感词 广告词 过滤
1