使用sklearn库实现朴素贝叶斯算法。使用词向量算法对文本数据进行处理。 资源内容包括: 1、完整的用于实现新闻分类任务的源码文件(ipynb格式) 2、哈工大停用词表 3、四川大学机器智能实验室停用词表 4、用于测试的新闻数据 贝叶斯定理由英国数学家贝叶斯(Thomas Bayes 1702-1761)发展 用来描述两个条件概率之间的关系 在B条件下A发生的概率: P(A∣B)=P(AB)/P(B) 在A条件下B发生的概率: P(B∣A)=P(AB)/P(A) 则:P(A∣B)P(B) = P(B∣A)P(A) 可导出:P(A∣B)=P(B∣A)P(A)/P(B) 或 P(A∣B) P(B) = P(B∣A)P(A) 贝叶斯公式: P(Y|X)=P(X|Y)P(Y) / P(X) 在机器学习中: X:代表特征向量 Y:代表类别 P(X):先验概率,是指根据以往经验和分析得到的概率。 P(Y|X):后验概率,事情已经发生,这件事情发生的原因是由某个因素引起的可能性的大小 P(X|Y):条件概率,在已知某类别的特征空间中,出现特征值X的概率
2022-05-11 17:06:15 9.82MB 算法 分类 人工智能 机器学习
dbn模型matlab代码BNT-SM 用于学生建模的贝叶斯网络工具箱(BNT-SM)旨在促进在学生建模社区中使用动态贝叶斯网络。 BNT-SM输入一个数据集和一个由研究人员假设的贝叶斯网络模型的紧凑XML规范,以描述学生知识和观察到的行为之间的因果关系。 BNT-SM使用贝叶斯网络工具箱生成并执行代码以训练和测试模型。 BNT-SM使研究人员可以轻松地探索关于学生模型中知识表示的不同假设。 例如,通过改变贝叶斯网络的图形结构,我们研究了补习干预如何影响学生的知识状态-干预是可能脚手架还是可以帮助学生学习。 主页 安装 BNT-SM2.0.zip可以在“下载”下下载。 它是在Matlab中实现的,因此您需要安装并运行Matlab。 典型用法示例 下载并解压缩BNT-SM后,启动Matlab并执行 >> cd src >> setup >> cd ../model/kt >> [property evidence hash_bnet] = RunBnet('property.xml'); Property.xml是一个XML文件,用于指定我们正在构建的贝叶斯网络。 在目录BNT-SM /
2022-05-11 12:33:17 6.35MB 系统开源
1
CNO-SBL 论文题为“基于协作神经动力学优化的稀疏贝叶斯学习”的源代码
2022-05-11 09:04:29 2.67MB 代码
实验介绍 1.实验内容 本实验包括: 基于朴素贝叶斯算法的言论过滤器 基于朴素贝叶斯算法实现垃圾邮件过滤 2.实验目标 通过本实验掌握朴素贝叶斯算法原理,熟悉朴素贝叶斯算法的简单应用。 【言论过滤器】 实验步骤:【言论过滤器】- 概述 以在线社区留言为例。为了不影响社区的发展,我们要屏蔽侮辱性的言论,所以要构建一个快速过滤器,如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标志为内容不当。过滤这类内容是一个很常见的需求。对此问题建立两个类型:侮辱类和非侮辱类,使用1和0分别表示。
2022-05-10 10:02:50 70KB 机器学习 人工智能
1
贝叶斯网络上的信念传播 这是一个在贝叶斯网络 (BN) 上运行循环信念传播的程序,并为网络上的每个节点生成边缘化概率。 算法细节参考 ,随着使用bethe聚类图而不是BN的纯因子图的变化。 输入格式应为 用法 $ python bp < .bif file path > [-o output file] [-t threshold] Options: -o, --output output file name, default to ' result.txt ' -t, --threshold threshold for convergence default to 1e-10 致谢 BIF 解析器由提供。 项目中的代码用于华盛顿大学的作业 3。
2022-05-09 21:34:42 12KB Python
1
基于朴素贝叶斯分类的垃圾词检测 语言go python go get -u 的方式进行安装 EXPLAINATION config.json 服务运行配置文件 SOCK_FILE: 服务以Unix Domain Socket 方式运行的时候sock文件的存放位置 WORKSPACE: 代码根目录,spamcheck.go文件的位置 CLASSES: 分类类别,至少2个。每个分类需要有对应的先验概率词典文件,示例:分类为adwords,则同级目录下需要有adwords.txt,字典越大,服务的分类结果越准确。 DICTIONARYFILE:sego库分类字典,需要手动指定,文件路径为绝对路径;分词准确度可以通过自定义字典进行替换。 SOCKET_BUFFER_SIZE:服务以Unix Domain Socket的方式运行的时候,缓冲区大小,可以根据数据量的大小进行调试。 spamcheck.go: 垃圾词检测主文件 README.md:服务介绍文件 requirements.txt: 项目依赖第三方库列表 *.txt: 根据config.json 中CLASSES 指定的
2022-05-09 11:04:31 7KB 数据挖掘 人工智能 机器学习 go
题目:有两碗曲奇,碗A有30个香草曲奇和10个巧克力曲奇,碗B两种曲奇各20个。取到香草曲奇,从A中拿到的概率。(jupyter notebook实现,贝叶斯定理题目编程实战)
2022-05-09 09:07:53 193KB jupyter 文档资料 ide python
1
贝叶斯算法在反垃圾邮件技术中的应用.doc
2022-05-08 14:07:13 55KB 文档资料 算法
大数据-算法-选择性贝叶斯分类算法研究.pdf
2022-05-08 09:08:37 5.29MB 算法 big data 分类
贝叶斯网络算法及建模应用,数据挖掘
2022-05-07 22:26:35 2.44MB 贝叶斯 算法 建模
1