使用Python实现朴素贝叶斯算法实现垃圾邮件分类 一、实验任务内容 1、分解各类先验样本数据中的特征 2、计算各类数据中,各特征的条件概率 3、分解待分类数据中的特征 4、计算各特征的各条件概率的乘积 5、结果中的最大值就是该样本所属的类别 二、实验步骤及结果 1、得到数据集和标签集,返回列表参数,返回单词转换为向量之后的列表。 2、通过训练得到贝叶斯分类模型 3、用朴素贝叶斯文本分类器对两个测试样本进行分类,利用正则函数进行解析 4、导入垃圾邮件和非垃圾邮件各25个并解析;构建训练集和测试集,利用贝叶斯分类模型来预测测试集,输出贝叶斯预测的准确率 5、输出测试10次的平均值 6、输出去重的单词列表和贝叶斯分类模型测试的准确率,测试10次的准确率的平均值。 三、实验心得 朴素贝叶斯确实是很好的预测分类的算法,但是这个算法还是有点过分的依赖训练集了,一些基本的概率计算还是根据训练集的结果得来的(比如40个训练集,10个测试集,它输出的准确率是0.5),预测的结果很大程度上取决于训练集的好坏,一旦训练集数据趋势有误会对结果造成严重的影响。
1
51单片机PID的算法实现程序
2022-11-17 17:58:02 38KB 51单片机 PID
1
使用C#语言实现的热力图算法,有WPF示例程序,可直接运行看效果。
2022-11-16 10:05:31 202KB 热力图 C# 源码
1
1.注释非常详尽,几乎每个函数都有注释,在CUDA11与VS2019下实现,并行加速效果十分显著! 2.同时实现了CPU多线程并行计算和CUDA并行计算两个版本,可以通过宏来选择
2022-11-15 17:27:07 1.42MB 中文分词 C++ cuda 多线程
1
信息安全课的一个实验作业,要求采用LSB算法实现BMP图像中的信息隐藏及提取,写完后感觉这个算法还是蛮有意思滴~压缩包内附上实验报告,仅供各位参考~
2022-11-15 15:14:55 450KB 水印
1
A*算法实现的迷宫最短路径求解,语言使用C++,有兴趣的童鞋可以看一看
2022-11-14 20:37:27 8KB AStar 迷宫
1
人工智能:A*算法实现八数码(C++),A*(A-Star)算法是一种静态路网中求解最短路最有A star算法在静态路网中的应用效的方法。
2022-11-13 21:12:17 75KB 人工智能 A*算法 八数码 c++
1
【车牌识别】基于模板匹配算法实现车牌识别matlab源码1.zip
2022-11-13 14:39:08 2.41MB 简介
1
全相位频谱分析(apFFT)是传统FFT的一种改进算法,能改善FFT的栅栏效应和截断效应,具有频谱泄露少、相位不变的特性。介绍采用FPGA器件实现apFFT算法,精度高于模拟式测量,并且适用性强、成本低,所得到的QuratusII仿真结果与Matlab软件仿真结果一致。
2022-11-12 22:06:04 281KB FPGA
1
【配电网重构】基于粒子群算法实现配电网重构含Matlab源码
2022-11-12 12:02:06 280KB
1