敏感词汇sql文件,可用于对平台用户在不平场景下进行的昵称设置等进行过滤
2022-05-11 15:36:30 639KB 过滤,敏感词
1
sensitive-word-filter     该项目作为一个敏感词检测工具,具有敏感词获取、敏感词处理、敏感词替换等基本功能,还支持用户自己实现对应的敏感词获取器 和 敏感词解析器实现一些自定义的功能。 实现原理     底层的实现原理采取的是AC自动机算法,AC自动机是在KMP算法和字典树上演变出来的一种多模匹配的算法。时间复杂度只取决于待分析文本的长度,和敏感词的数量无关。     有兴趣的小伙伴可以阅读关于KMP 和 AC自动机相关的文档或者博客,相信你会收益颇丰 jar包下载 代码示例 // 1.word.txt 敏感词不完善 SensitiveWordFilter sensitiveWordFilter = new SensitiveWordFilter(); // 普通字符替换 System.out.println(sensitiveWordFilter.replaceF
2022-05-03 13:17:51 48KB Java
1
Sensitive-word-filtering 敏感词过滤 直接从Java版DFA算法实现,转移过来,并未作修改,词库直接从百度搜索的一个暂用。 可替换成其他词库,也可自行添加词条。 在项目init方法中调用ReadSwfDict加载词库 在检查点调用Match方验证,或调用Repl方法替换 具体使用见swf_test.go
2022-05-03 12:59:52 3KB Go
1
Sensitive敏感词过滤类,源代码分享(本人开发的代码,可以使用,但是禁止通过其他方式进行转载,谢谢)
2022-05-03 12:57:05 908KB Sensit 敏感词 敏感词过滤 源码
1
文件包含四种网站敏感词检测的方法,还有一个敏感词库,可以根据需要选择、修改。
2022-04-13 15:02:31 3.37MB 敏感词
1
主要介绍了C#敏感词过滤实现方法,涉及C#针对字符串操作的常用技巧,非常具有实用价值,需要的朋友可以参考下
2022-04-10 18:33:37 59KB C# 敏感词过滤
1
Java实现DFA算法实现敏感词过滤,并且支持跳词,如中 国,中*国等,并包含了比较全的敏感词库,也摘抄了其它几种敏感词过滤方法,只对DFA方式的敏感词做了优化,支持跳词
2022-04-05 16:44:51 3.41MB dfa  敏感词 过滤 java
1
Author: Richard Zhang. Mail: 89205975@qq.com This library filters sensitive phrases by user's configuration. Currently, only support UTF8 & ANSI encoded strings. The matching rule is max-length-matching, the library tries to match sensitive phrase as long as possible. For example: "damn fucker" and "damn" are all in sensitive dictionary, the sentence "he's a damn fucker" will be processed to "he's a ***********". Even user insert some spaces or non-letter characters between sensitive words, the library is also able to deal with it. For example: "Bad boy" is added to sensitive dictionary, "Bad.boy", "Bad boy", "Bad/boy" can also be filtered. "你去死" is added to sensitive dictionary, "你 去 死", "你/去 死", "你 去 .死" can also be filtered. Compiling requirement: 1. STL C++11 2. BOOST multi_index_container Performance test condition: 1. Giving a sentence around 100 bytes (English & Chinese mixed) 2. Dirty phrases around 10,000 3. Do 1,000 loop test 4. Intel I7 CPU Test result: For each loop, it cost around 100us
2022-04-02 17:47:14 4KB 脏话 敏感词 聊天 过滤
1
java使用dfa算法实现敏感词过滤,此算法效率最高,附带了一个敏感词库,轻松搞定论坛网站的敏感词过滤问题。
2022-03-30 13:14:46 1.39MB 敏感词过滤 dfa Java
1
java敏感词检索工具,用于社区等提问信息的过滤检索;
2022-03-26 23:11:13 18KB java 敏感词
1