sensitive-word-filter
该项目作为一个敏感词检测工具,具有敏感词获取、敏感词处理、敏感词替换等基本功能,还支持用户自己实现对应的敏感词获取器 和 敏感词解析器实现一些自定义的功能。
实现原理
底层的实现原理采取的是AC自动机算法,AC自动机是在KMP算法和字典树上演变出来的一种多模匹配的算法。时间复杂度只取决于待分析文本的长度,和敏感词的数量无关。
有兴趣的小伙伴可以阅读关于KMP 和 AC自动机相关的文档或者博客,相信你会收益颇丰
jar包下载
代码示例
// 1.word.txt 敏感词不完善
SensitiveWordFilter sensitiveWordFilter = new SensitiveWordFilter();
// 普通字符替换
System.out.println(sensitiveWordFilter.replaceF
2022-05-03 13:17:51
48KB
Java
1