根据敏感词库配置,检测一段文字中是否含有关键字(支持中英文),如果有可将其替换为***,支持UTF8 和 GBK两种编码,内含完整源码,2016敏感词库和测试用例.
2023-03-29 10:00:39 657KB C++ 敏感词检测 源码 中文
1
本代码实现了敏感词检测。findcode是一个用来将敏感词与句子中排序后的单词先按字母顺序排序然后进行逐一比较的函数;如果两者相同,则return1;用数组下标0-25分别表示a-z字母,对应的每个下标对应的数组元素的值就是该字母在该词中出现的次数。part是一个将字符串中的单词剥离的函数;将敏感词从字符串中剥离出来,将输入的打乱每个单词内部字母顺序的句子中每个“词“剥离出来。
2023-02-22 09:33:01 2KB C语言 敏感词检测
1
敏感词检测工具类 付敏感词库,敏感词库各种类别已合并
2022-06-30 16:20:50 12KB 敏感词词库 敏感词检测 敏感词库
1
文件包含四种网站敏感词检测的方法,还有一个敏感词库,可以根据需要选择、修改。
2022-04-13 15:02:31 3.37MB 敏感词
1
一款高性能敏感词(非法词/脏字)检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。
2022-02-01 18:03:17 21.51MB 高性能敏感词 模糊搜索
敏感词过滤 python3 测试过滤效果 python -m speachless.test 输出json文件 至 dist python -m speachless.sensitive_tree 简介 speachless/lib 敏感词库, 三个种类,涉政, 色情, 自定义. speachless/sensitive_tree.SensitiveTree 根据词库中的敏感词构造检测tree speachless/sensitive_filter.SensitiveFilter 检测输入内容是否与敏感词匹配 使用 git archive master | tar -x -C /project/xxx/speachless ** 应该将以下对象 作为全局变量避免每次重新初始化 tree 造成额外开销 ** ** 当导入外部词库时, 应避免词库中存在特殊字符** sensit
2021-10-25 20:03:07 10KB python text-filter china-law Python
1
java 用于检测用户写的文案是否包含敏感词,里面包含多种检测方式以及检测效率,总有一种方式适合你
2021-08-13 16:18:34 6.8MB java敏感词过滤 文本敏感词
1
敏感词检测程序,离线版,不需联网,可用于检测文本是否包含了敏感词
java网站敏感词检测
2021-04-21 21:00:48 6.88MB java
1
直接上传网站空间后调用:http://你的域名/str.php?str=检测的语句内容,返回结果为json,非常简单的一个demo,速度很快,含超大的一个敏感词库,3个文件实现敏感词检测api
2021-02-27 12:47:21 7KB api php 敏感词
1