Author: Richard Zhang. Mail: 89205975@qq.com This library filters sensitive phrases by user's configuration. Currently, only support UTF8 & ANSI encoded strings. The matching rule is max-length-matching, the library tries to match sensitive phrase as long as possible. For example: "damn fucker" and "damn" are all in sensitive dictionary, the sentence "he's a damn fucker" will be processed to "he's a ***********". Even user insert some spaces or non-letter characters between sensitive words, the library is also able to deal with it. For example: "Bad boy" is added to sensitive dictionary, "Bad.boy", "Bad boy", "Bad/boy" can also be filtered. "你去死" is added to sensitive dictionary, "你 去 死", "你/去 死", "你 去 .死" can also be filtered. Compiling requirement: 1. STL C++11 2. BOOST multi_index_container Performance test condition: 1. Giving a sentence around 100 bytes (English & Chinese mixed) 2. Dirty phrases around 10,000 3. Do 1,000 loop test 4. Intel I7 CPU Test result: For each loop, it cost around 100us
2022-04-02 17:47:14 4KB 脏话 敏感词 聊天 过滤
1
java使用dfa算法实现敏感词过滤,此算法效率最高,附带了一个敏感词库,轻松搞定论坛网站的敏感词过滤问题。
2022-03-30 13:14:46 1.39MB 敏感词过滤 dfa Java
1
混音 0.0.10 R包,用于基于参考的多重插补,可对带有方案偏差的纵向试验进行敏感性分析 我们已经将Stata程序mimix的功能移植到R中,并添加了一些额外的功能,包括因果模型的选项以及Delta调整。 mimix的目的如本文所述 Suzie Cro,Tim P.Morris,Michael G.Kenward和James R.Carpenter的协议偏差通过纵向插补进行多重插补进行基于参考的敏感性分析 并(在Stata中)键入“ ssc install mimix”以安装代码,并键入“ help mimix”以阅读帮助文档 可用于敏感性分析的5种方法(加上因果关系)是 方法 选项cmd 需要参考组 随机臂 MAR ñ 跳转到参考 J2R ÿ 复制参考中的增量 CIR ÿ 复制参考 CR ÿ 最后均值结转 LMCF ñ 因果关系 因果关系 ÿ 有关因果模型的
2022-03-29 12:09:24 2.86MB R
1
GJB152 军用设备和分系统电磁发射和敏感度测量
2022-03-28 13:34:49 1.55MB GJB 国军标 电磁
1
java敏感词检索工具,用于社区等提问信息的过滤检索;
2022-03-26 23:11:13 18KB java 敏感词
1
matlab神经网络garson's modified equation敏感性分析程序,用该程序,通过输入连接权重,就可以得出每个因素对结果的敏感值,并绘出柱状图
1
这是一个微博敏感词搜索程序,把需要搜索的敏感词存'weibo.positive.train'里 ,每隔一定时间从微博API接口申请chunk,利用positive和negative结合的方法,完全结果输出到'weibo.censorshipOutput'
2022-03-21 11:01:52 5.91MB 微博 敏感词 搜索 Python
1
针对当前手机客户端安全性低的问题,通过提取Android系统手机端的apk文件,并通过反编译生成smali文件,得到的smali文件提取对应的敏感API。将上述得到的敏感API,通过AHP与神经网络算法计算加权权重,以提高权重的准确率。最后再通过数据挖掘得到检测规则,进而分辨出训练集中的恶意软件;最后通过手机恶意软件检测检测试验,经改进后对480个恶意软件的识别中,本改进算法识别率为76.7%,高于传统BP算法的56.8%,说明本改进具有一定的优势,但还需要进行改进。
1
电磁干扰三要素 1、干扰源 2、耦合途径 3、敏感(接收)装置
2022-03-17 09:45:19 1.55MB EMC测试
1
包含常用的敏感词库,垃圾帖子识别,垃圾邮件等必备,有需要的懂,人工整理过了
2022-03-16 15:47:28 25KB 敏感词库
1