大数据-算法-针对类别不平衡和代价敏感分类问题的特征选择和分类算法.pdf
2022-05-08 14:07:01 5.7MB 算法 big data 分类
大数据-算法-非线性优化方法在数值模式敏感性分析中的应用.pdf
2022-05-04 09:07:17 4.23MB 算法 big data 文档资料
sensitive-word-filter     该项目作为一个敏感词检测工具,具有敏感词获取、敏感词处理、敏感词替换等基本功能,还支持用户自己实现对应的敏感词获取器 和 敏感词解析器实现一些自定义的功能。 实现原理     底层的实现原理采取的是AC自动机算法,AC自动机是在KMP算法和字典树上演变出来的一种多模匹配的算法。时间复杂度只取决于待分析文本的长度,和敏感词的数量无关。     有兴趣的小伙伴可以阅读关于KMP 和 AC自动机相关的文档或者博客,相信你会收益颇丰 jar包下载 代码示例 // 1.word.txt 敏感词不完善 SensitiveWordFilter sensitiveWordFilter = new SensitiveWordFilter(); // 普通字符替换 System.out.println(sensitiveWordFilter.replaceF
2022-05-03 13:17:51 48KB Java
1
Sensitive-word-filtering 敏感词过滤 直接从Java版DFA算法实现,转移过来,并未作修改,词库直接从百度搜索的一个暂用。 可替换成其他词库,也可自行添加词条。 在项目init方法中调用ReadSwfDict加载词库 在检查点调用Match方验证,或调用Repl方法替换 具体使用见swf_test.go
2022-05-03 12:59:52 3KB Go
1
Sensitive敏感词过滤类,源代码分享(本人开发的代码,可以使用,但是禁止通过其他方式进行转载,谢谢)
2022-05-03 12:57:05 908KB Sensit 敏感词 敏感词过滤 源码
1
不同混沌序列的产生、初始值敏感性、自相关、互相关性能
2022-05-03 12:07:02 4KB 综合资源
敏感词汇,做网站,app必备,已分类好,用程序导入数据库即可使用 做好了10个分类,网站和app已经够用了,欢迎下载使用
2022-05-02 13:00:12 232KB 分类 数据库 数据挖掘 人工智能
1
OpenCossan是一个基于Matlab的不确定性量化和管理工具箱。 OpenCossan is a Matlab-based toolbox for uncertainty quantification and management. 实现的框架包括第三方软件集成(如ANSYS)、高效的数值算法(如线性采样)和用于高性能计算的并行化。
2022-04-27 09:12:10 14.04MB 综合资源 源码软件
1
以分类精度为目标的传统分类算法通常假定:每个样本的误分类具有同样的代价且每类样本数大致相等.但现实数据挖掘中该假定不成立时,这些算法的直接应用不能取得理想的分类和预测.针对此缺隙,并基于标准的SVM,通过在SVM的设计中集成样本的不同误分类代价,提出代价敏感支持向量机(CS-SVM)的设计方法.实验结果表明CS-SVM是有效的.
2022-04-26 22:04:15 343KB 分类  支持向量机  代价
1
基于网站路径【深入的、动态的】检测指定目录下的敏感文件,并支持自动过滤大部分不存在的路径。 主要关注于根目录下的备份文件扫描,但对于根目录下其他敏感文件也可以完美支持。 支持自动分割带有多个目录层级的为多个基本URL进行扫描,但暂不支持自动递归目录进行扫描。 能够根据特定的规则生成动态字典文件,主要是实现动态替换(日期、域名、路径等)属性。 能够根据响应情况,自动筛选出不存在的文件,减少扫描过程中的误报。 能够自动处理字典的编码逻辑,自动编码访问中文和特殊字符命名的路径。 能够记录程序的详细日志输出,辅助单独的结果文件进行判断。 添加字典频率筛选功能,仅加载频率在某一个阈值范围的字典 [新增功能] 支持简单分析命中的URL,并自动加入hit_xxx.lst加入规则字典 [新增功能]
2022-04-25 18:00:13 73KB 源码软件 敏感文件
1