垃圾邮件过滤器 垃圾邮件过滤器:基于朴素贝叶斯和逻辑回归将电子邮件分类为垃圾邮件或火腿 如何运行这个? 编译和运行程序的步骤: 朴素贝叶斯:下载并解压包含朴素贝叶斯程序文件的文件夹:NBMain.java 和 NaiveBayes.Java 输入文件夹结构:示例 F:\temp \test \spam \ham \train \spam \ham stopwords.txt **主驱动程序 - NaiveBayes.java 参数 0 - 包含 test + train 文件夹 + SpamWords.txt 的文件夹 参数 1 - 是或否表示是否考虑
2022-03-07 13:54:15 746KB Java
1
垃圾邮件过滤器 基于贝叶斯网络的垃圾邮件过滤器 为垃圾邮件检测实现朴素贝叶斯分类器 [60] 朴素贝叶斯是一种简单有效的机器学习方法,用于解决各种问题,包括垃圾邮件检测的应用。 您将实现一个朴素贝叶斯分类器,将电子邮件消息分类为垃圾邮件(即垃圾邮件)或火腿(即合法邮件)。 本次作业的训练和测试数据集可以在 HW5_code.zip 中找到。训练集由不同目录中的 800 条垃圾邮件和 800 条火腿消息组成,测试集包含 400 条垃圾邮件和 400 条火腿消息。 两组都具有完整的原始标题信息。 每封电子邮件都是一个单独的文本文件。 数据组织如下: /train/ham/ /train/spam/ /test/ham/ /test/spam/ 提供的代码读取训练集中的所有消息,提取每个单词,删除标点符号和数字,构建所有单词的字典,并存储单词计数和单词概率。 此代码在框架代码文件 NBSp
2022-03-07 13:49:18 5KB Java
1
介绍 是高级垃圾邮件过滤系统和电子邮件处理框架,它允许通过许多规则评估邮件,包括正则表达式,统计分析和自定义服务(例如URL黑名单)。 Rspamd对每条消息进行分析,并给出一个决定,MTA可能会将该结论与其他信息(例如可能的DKIM签名或为消息建议的修改)一起用于进一步处理(例如,拒绝消息或添加表示垃圾邮件的特殊标头) 。 Rspamd可以充当允许与流行的MTA系统(如Postfix或Sendmail)直接交互。 Rspamd旨在每秒每秒处理数百条消息,并提供许多有用的功能,其中包括允许访问各个方面的消息处理的全面以及用于访问外部资源(例如DNS,HTTP或HTTP)的网络API。甚至通用的TCP / UDP服务。 入门 是研究如何安装和配置Rspamd的一个很好的起点。 Rspamd被用于主要Linux发行版,也可以通过,NetBSD 和。 我们建议您使用Rspamd项目提供的软件包(如果适用于您的操作系统),而不要使用某些Linux发行版可能提供的软件包,因为它们通常已经过时,并且不能提供理想的垃圾邮件过滤质量,也不受Rspamd项目支持。 垃圾邮件过滤功能 Rspamd
2022-03-07 13:38:30 5.66MB c lua email rspamd
1
CSV到HTML表 将任何CSV文件显示为可搜索,可过滤的漂亮HTML表。 完成100%JavaScript。 查看工作示例: : 用法 1.克隆此存储库(在命令行中) git clone git@github.com:derekeder/csv-to-html-table.git cd csv-to-html-table 2.将CSV文件添加到data/文件夹 3.在index.html中,在CsvToHtmlTable.init()函数中设置选项 < script > CsvToHtmlTable . init ( { csv_path : 'data/Health Clinics in Chicago.csv' , element : 'table-container' , allow_download : true , csv_opti
2022-03-07 11:16:52 14KB CSS
1
在当今的数字世界中,消费的内容种类繁多,例如书籍、视频、文章、电影等,找到自己选择的材料已成为一项万无一失的任务。 另一方面,数字内容提供商希望在最长时间内让越来越多的用户参与到他们的服务中。 推荐系统在哪里出现 内容提供商通过内容向用户提供建议 在本文中,我们提出了一个电影推荐系统。电影推荐系统的目的是为用户提供准确的电影推荐。 通常基本推荐系统做出推荐考虑以下因素之一; 用户偏好称为基于内容的过滤或类似用户的偏好称为协同过滤。 要创建稳定且准确的推荐系统,将使用基于内容的过滤
2022-03-06 16:51:16 554KB Movies Recommendation System
1
这是我在 2013 年秋季为 COMS1004 编写的一个项目:哥伦比亚大学计算机科学导论。 COMS1004 2013 秋季编程项目 5 2013 年 11 月 27 日 阿曼达·宋 (UNI: as4513) 内容: 垃圾邮件过滤器 地址查找器 ================================================== ======================== 垃圾邮件过滤器 如何运行程序: 命令行参数: args[0]: keywords (text file) args[1]: blacklist emails (text file) args[2]: messages (text file) args[3]: output (text file) 班级名单 主类:SpamTest 支持类:Message、Filter、StringPar
2022-03-04 22:07:00 12KB Java
1
文章:http://blog.sina.com.cn/s/blog_5f49acab0102x7i5.html 在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个 集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元素存在计算机中,遇到一个新 元素时,将它和集合中的元素直接比较即可。一般来讲,计算机中的集合是用哈希表(hash table)来存储的。它的好处是快速准确,缺点是费存储空间。当集合比较小时,这个问题不显著,但是当集合巨大时,哈希表存储效率低的问题就显现出来 了。比如说,一个象 Yahoo,Hotmail 和 Gmai 那样的公众电子邮件(email)提供商,总是需要过滤来自发送垃圾邮件的人(spamer)的垃圾邮件。一个办法就是记录下那些发垃圾邮件的 email 地址。由于那些发送者不停地在注册新的地址,全世界少说也有几十亿个发垃圾邮件的地址,将他们都存起来则需要大量的网络服务器。如果用哈希表,每存储一亿 个 email 地址
2022-03-04 14:39:39 2KB 布隆过滤器
1
显卡过滤反截屏演示demo,能控制目前市面上流行的所有的截屏软件。
2022-03-04 12:41:24 125KB 反截屏演示demo
1
DZ论坛6.1不良信息过滤集合,过滤非法信息的
2022-03-03 16:18:08 5KB DZ论坛6.1不良信息过滤集合
1
毕业设计--基于Django的图书推荐系统和论坛 feature 登录注册页面 基于协同过滤的图书的分类,排序,搜索,打分功能 基于协同过滤的周推荐和月推荐 读书分享会等活动功能,用户报名功能 发帖留言论坛功能 fixed 首页导航栏链接错误 首页面为空 登录注册页面 推荐跳转登录 周推荐用户没有评分时随机推荐 按照收藏数量排序 重新设计了 action 和UserAction model,拆分出了UserAction 书模型 浏览量 每次刷新页面的浏览数 收藏量 user manytomany field 每个用户收藏一次 评分 rate 每个用户评分一次 在书籍下面的评论加点赞功能 注册和登录 推荐 论坛 周推荐 安装运行方法 pip install -r requirements.txt python manage.py runserver
2022-03-02 16:04:29 9.34MB python django collaborative-filtering Python
1