敏感词过滤 python3
测试过滤效果
python -m speachless.test
输出json文件 至 dist
python -m speachless.sensitive_tree
简介
speachless/lib 敏感词库, 三个种类,涉政, 色情, 自定义.
speachless/sensitive_tree.SensitiveTree 根据词库中的敏感词构造检测tree
speachless/sensitive_filter.SensitiveFilter 检测输入内容是否与敏感词匹配
使用
git archive master | tar -x -C /project/xxx/speachless
** 应该将以下对象 作为全局变量避免每次重新初始化 tree 造成额外开销 **
** 当导入外部词库时, 应避免词库中存在特殊字符**
sensit
1