敏感词过滤算法全套,包含敏感词库,希望能帮到大家吧。
2021-12-25 20:51:18 95KB 敏感词过滤 过滤算法
1
本类库的敏感词替换算法,效率比str_replace高4倍(附6仟个敏感词),这个类库是没有学习过Trie树的时候写的,之后我接触了AC算法,我的算法和AC是类似的结构和逻辑,都是利用树,空间换时间,对搜索/替换海量数据帮助很明显。 strtr是KMP算法的代表,在对待海量词汇上面,并无优势,并且每次都要加载词库到内存。 使用AC算法写成扩展,将词库加载内存中,是最好的处理方式。 所以badword.src.php可供学习AC算法、学习查找替换等。
2021-12-22 16:06:35 3KB 源码 示例 PHP 敏感词过滤
php做的敏感词过滤,功能很强大喔!神马敏感词都得过滤掉,一切讲究的是河蟹!吼吼
2021-12-15 13:18:44 2KB 敏感词过滤,php,神马
1
基于百度先进的自然语言处理技术,一站式检测识别文本中夹杂的色情、推广、辱骂、违禁违法等垃圾内容
2021-12-15 12:13:19 61KB MVC 过滤
1
MyCommunity 项目介绍 MyCommunity 是一个模仿知乎的简单问答网站,基于SpringBoot+MyBatis实现。 用户可以发表帖子、评论、点赞、私信、相互关注、查看用户信息等。 同时,网站拥有敏感词过滤、热门帖子排行、搜索帖子、系统消息通知等功能。 项目演示 项目演示地址 (emmmmm...之前被我不小心把线上代码删了QAQ,网站展示暂时失败) 用户名: 时崎狂三 密码: 123456 (PS: 或者其它9个精灵名字) (PS: 项目现在已经不能注册,请使用现有账号密码登录 by.12.21) 项目截图 用到的技术 技术 名称 Spring Boot 容器+MVC框架 Spring Security 认证和授权框架 MyBatis ORM框架 Elasticsearch 搜索引擎 Redis 分布式缓存 Thymeleaf 模板引擎 Quartz 定时任务支持
2021-11-17 20:51:23 751KB Java
1
敏感词过滤系统 更多详见 Ubuntu Linux下环境构建: sudo apt-get install python-pip pip install nltk pip install jieba pip install pymongo Config下config文件: 可以进行服务器配置,针对数据库中预定集合的不同区段列, 可以选择语言(中文,英文), 可以设置要过滤的文章数量,时间替换从最近前推 添加邮件通知系统,SendMailFlag =“是”#“否” 结果:细分filter_status为1表示通过过滤,为0表示不通过过滤 stopwords_chs和stopwords_eng为过滤词黑名单 可以随时添加要过滤的单词,一行一个 如果添加的过滤词无法正确被jieba分词,则同样方法将需要过滤的词和词频加入到主字典dict文件中或者用户字典user_dict,一行一
2021-10-25 20:02:20 1.84MB 系统开源
1
NULL 博文链接:https://fanshuyao.iteye.com/blog/2394157
2021-10-15 11:16:55 9KB 源码 工具
1
适用于ssm及springboot项目
2021-09-18 20:02:25 6KB java敏感词过滤
1
在我们生活中的一些场合经常会有一些不该出现的敏感词,我们通常会使用*去屏蔽它,例如:尼玛 -> **,一些骂人的敏感词和一些政治敏感词都不应该出现在一些公共场合中,这个时候我们就需要一定的手段去屏蔽这些敏感词。下面我来介绍一些简单版本的敏感词屏蔽的方法。 (我已经尽量把脏话做成图片的形式了,要不然文章发不出去) 方法一:replace过滤 replace就是最简单的字符串替换,当一串字符串中有可能会出现的敏感词时,我们直接使用相应的replace方法用*替换出敏感词即可。 缺点: 文本和敏感词少的时候还可以,多的时候效率就比较差了 import datetime now = datetim
2021-09-11 11:43:02 224KB 敏感词 方法
1
java 敏感词过滤的设计思路和技术问题
2021-09-07 15:46:37 20KB java 敏感词
1