朴素贝叶斯算法实战 email邮件数据集,SogouC新闻数据集 Email_NB.py垃圾邮件过滤实现(Python3实现) Naive_Bay.py 朴素贝叶斯算法实现(Python3实现) 样本比较小,成功率大概为90% import numpy as np from functools import reduce """ 函数说明:创建实验样本 Parameters: 无 Returns: postingList - 实验样本切分的词条 classVec - 类别标签向量 """ def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], #切分的词条 ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], ['my', 'dalmation', 'is', 'so',
2023-04-06 12:03:35 196KB 贝叶斯
1
适合nlp入门,垃圾邮件数据集
2022-09-19 18:13:14 3.61MB 机器学习 自然语言处理
1
实验数据集:垃圾邮件数据集(http://archive.ics.uci.edu/ml/datasets/Spambase)。请从spambase.csv读入数据。 数据集基本信息如下:样本数: 4601,特征数量: 57, 类别:1为垃圾邮件,0为非垃圾邮件。
2022-08-22 09:06:54 687KB 深度学习 机器学习 pytorch MLP分类模型
1
4C2022 AI智慧物流挑战赛邮件数据集.zip
2022-06-17 16:04:07 123.52MB 人工智能 交通物流 数据集
TREC2005-2007垃圾邮件数据集.zip
2022-06-16 11:04:14 671.99MB 数据集
Udacity-机器学习入门 安然传奇 安然(Enron)丑闻是财务丑闻,最终导致安然公司(Enron Corporation)破产,该公司位于德克萨斯州休斯敦的美国能源公司,实际上是阿瑟·安徒生(Arthur Andersen)的解散,后者是美国五大审计和会计合伙企业之一世界。 除了是当时美国历史上最大的破产重组外,安然还被认为是最大的审计失败。 安然公司由肯尼思·莱(Kenneth Lay)于1985年合并休斯顿天然气公司和InterNorth公司后成立。 几年后,当杰弗里·斯基林(Jeffrey Skilling)被聘用时,他培养了一批高管人员,这些人员通过使用会计漏洞,特殊目的实体以及不良的财务报告,能够从失败的交易和项目中隐藏数十亿美元的债务。 首席财务官安德鲁·法斯托(Andrew Fastow)和其他高管不仅误导了安然公司董事会和审计委员会关于高风险会计的作法,而且还向亚瑟
2022-03-27 16:17:44 2.48MB JupyterNotebook
1
希拉里邮件数据集HillaryEmails,测试使用
2022-01-21 11:33:05 16.91MB 希拉里邮件数据集 HillaryEmails
1
需要用到的spam.text(垃圾邮件),ham.txt(非垃圾邮件)。(记得转换成UTF-8格式)以及stop_words.utf8
2021-12-15 17:05:40 1.19MB nlp 垃圾邮件分类 垃圾邮件数据集 python
1
安然搜索 我想稍微玩一下ElasticSearch的Java绑定,在这个过程中我做了一点有趣的应用。 EnronSearch是CMU Enron语料库中500,000封电子邮件的ElasticSearch索引。 安然搜索: 提供用于下载和索引安然电子邮件的命令行工具。 提供了一个基于Spark的小型Web应用程序,用于与索引语料库进行交互。 包括一些用于执行预输入搜索的漂亮JavaScript。 它在起作用: 正在安装 您需要启动并运行ElasticSearch服务器才能使用EnronSearch。 设置与该服务器相对应的ES_PORT和ES_HOST环境变量。 完成此操作后: 安装EnronSearch的相关程序包。 mvn package 下载Enron电子邮件语料库: java -cp target/classes:target/dependency/ * :.
2021-11-21 09:20:03 118KB JavaScript
1
安然电子邮件搜索 有关数据集的信息。 先决条件 节点> 4.0 下载的安然电子邮件数据集 怎么跑 克隆存储库,运行 npm install 下载并提取公共Enron电子邮件数据集。 使用以下方法解析数据集: node parser.js /Users/admin/Downloads/maildir/ 这将在export文件夹中创建一堆.json文件。 然后,确保Elasticsearch在localhost:9200上运行(默认情况下)并运行 node import.js 现在,所有json文件都以弹性方式导入。 要运行搜索界面,请运行 npm start #OR node server.js 并在网络浏览器中导航到localhost:3000 。 享受!
2021-11-18 18:04:11 7KB JavaScript
1