整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
2022-01-21 17:55:12 5.53MB NLPIR 分词 过滤停用词
1
JSP利用过滤器解决request中文乱码问题.docx
2022-01-21 14:09:49 16KB 开发
JSP用过滤器解决request getParameter中文乱码问题.docx
2022-01-21 14:09:45 16KB 开发
jsp用过滤器解决中文乱码问题的方法.docx
2022-01-21 14:09:45 15KB 开发
我们在开发系统或者应用的过程中,经常需要对用户提交的评论或者文章进行审核,对其中的敏感词进行校验或者过滤,本资源可以帮助各位小伙伴以一个简单的方式实现敏感词的过滤,代码精简易懂,可以应用在实际开发过程中
2022-01-19 18:02:21 4KB java 开发语言 后端 过滤器
tcpdump抓包高级技巧,抓包必备,绝对好用。。。。。。
2022-01-18 20:13:42 224KB tcpdump
1
【纯源码】易语言DNS服务器 中转服务器 过滤器。 在问答区求源码,给了一个帖子测试不能用,而且代码超复杂,反而改起来不方便。所以做了这个。 里面数据包处理程序用了原来程序的代码,其余代码自己写的,分享一下。
2022-01-17 19:08:50 8KB 易语言DNS服务器+中转服务器+
RLSFilter 递归最小二乘(RLS)过滤器的C ++实现
2022-01-17 10:30:25 13KB CMake
1
用过photoscan的人都会发现,正射影像里的房屋,树木物体边缘都会有锯齿状,而且变样了,严格的甲方是不会通过验收的,使得大家放弃使用photoscan跑正射影像。现在通过photoscan内置的过滤点云功能,使得问题得以解决。超清详细视频。
2022-01-15 21:03:40 26.29MB photoscan 点云过滤 正射影像 航测
AnomalyFilter 本项目应用孤立森林异常检测算法,过滤JMeter 在对Splunk 数据库进行压力测试过程中产生的异常性能数据。 背景 在压力测试和性能分析过程中,通常有两种情形会导致测试结果不准确: 一是由于JMeter 和LoadRunner 等工具在启动多线程是有一个爬坡过程,通常需要1-10秒钟左右,这个时间也不会很长。但在这个过程由于线程数量不定,导致了测试数据的可靠性降低。 二是由于现实测试中通常会存在网络异常的情形,极少量的异常值会大大影响对被测对象的性能评估。 在上述场景中,异常的数据与整个测试数据样本相比是很少的一部分,常见的分类算法例如:SVM、逻辑回归等都不合适。而孤立森林算法恰好非常适合上述场景,首先测试数据具备一定的连续性,其次异常数据具备显着的离群特征,最后异常数据的产生是小概率事件,因此,孤立森林算法在网络安全、交易欺诈、疾病监测等方面也有着广泛的
2022-01-15 14:53:42 390KB Python
1