提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法。首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型。仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率。
1
在学习《数据科学导引》第四章分类算法——决策树及朴素贝叶斯时可以参考本课件,基本原理通俗易懂,并举了相关例子,在决策树剪枝部分对课本内容做了补充,有兴趣可以翻阅。 汇报前查阅了很多相关资料,进行了整合和总结,如果有不甚清晰的地方可以私聊探讨,本人在课堂上对本部分做讲解的时候收到了很好的反响。 如果有不同的见解及学习方法,欢迎在评论区留言提问或提出建议。
2022-04-21 13:05:16 36.82MB 决策树 机器学习 朴素贝叶斯算法
1
【达摩老生出品,必属精品,亲测校正,质量保证】 资源名:matlab 贝叶斯和通用阈值软阈值图像去噪方法MATLAB程序 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系我进行指导或者更换。 适合人群:新手及有一定经验的开发人员
2022-04-19 09:06:03 13KB matlab 贝叶斯 阈值软阈值 图像去噪
朴素贝叶斯数字分类器 基于平均像素亮度和标准偏差的手写数字0或1的朴素贝叶斯分类器 2020年9月 ASU MCS计划课程CSE 575的项目1-统计机器学习 使用的技术: Python,Numpy,Scipy
2022-04-18 20:33:56 129KB Python
1
是统计模式识别的基本方法和基础。 是“最优分类器”:使平均错误率最小 条件: 类别数一定, (决策论中把类别称作状态) 已知类先验概率和类条件概率密度
2022-04-18 09:31:37 757B 贝叶斯决策
1
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。
1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程:将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化,使用朴素贝叶斯算法进行分类。 3、主要内容:搜狗新闻数据集SogouC,标签包括财经、IT、健康、体育、旅游、教育、招聘、文化和军事;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。
2022-04-17 16:08:07 185KB 朴素贝叶斯算法 机器学习 新闻分类
一个将OWL本体直接转换成贝叶斯网络的原型系统
2022-04-17 10:31:08 2.38MB 贝叶斯网络 不确定性
1