大数据期末大作业 数据挖掘, 爬虫相关,朴素贝叶斯分类器python 简介: 运用爬虫技术以及朴素贝叶斯分类对抓取的新闻进行分类, 分析每种新闻在网站中的占比 已定义的新闻类别: 财经 科技 汽车 房产 体育 娱乐 其他 1. 环境以及依赖 python环境 python==3.9 依赖的第三方库: jieba parseurl bs4 numpy 2. 使用模型 朴素贝叶斯分类器 实现:纯python实现 3. 数据来源 新闻共分7类,新闻信息在此采集: 1 财经 http://finance.qq.com/l/201108/scroll_17.htm 2 科技 http://tech.qq.com/l/201512/scroll_02.htm 3 汽车 http://auto.qq.com/l/201512/scrollnews_02_2.htm 4 房产 http://gd.qq.com/l/house/fcgdxw/more_7.htm 5 体育 http://sports.qq.com/l/201512/scrollnews_01_2.htm 6 娱乐 http
2024-06-24 14:11:55 1.47MB 数据挖掘 python 朴素贝叶斯分类器
1
从数据中学习结构是贝叶斯网络研究最重要的基本任务之一。 特别地,学习贝叶斯网络的可选结构是一个不确定的多项式时间(NP)难题。 为了解决这个问题,已经提出了许多启发式算法,并且其中一些在不同类型的先验知识的帮助下学习贝叶斯网络结构。 然而,现有算法对先验知识有一些限制,例如质量限制和使用限制。 这使得很难在这些算法中很好地利用先验知识。 在本文中,我们将先验知识引入了马尔可夫链蒙特卡洛(MCMC)算法,并提出了一种称为约束MCMC(C-MCMC)算法的算法来学习贝叶斯网络的结构。 定义了三种类型的先验知识:父节点的存在,父节点的不存在以及分布知识,包括边缘的条件概率分布(CPD)和节点的概率分布(PD)。 所有这些类型的先验知识都可以轻松地用在该算法中。 我们进行了广泛的实验,以证明所提出的方法C-MCMC的可行性和有效性。
2024-04-09 10:39:16 2.16MB 研究论文
1
2023.10.2官网发布的新版本。下载完成后,填写学生姓名和学校就可以免费使用,请勿商用。 用于构建、学习和探索贝叶斯网络和其他概率图形模型。
2024-03-06 19:01:48 19.31MB 网络 网络
1
pdf_core的依赖扩展,将文件解压后拷贝到pdf_core下对应目录,属于依赖文件,github上开源
2024-01-02 23:48:58 9.55MB javascript
1
软件: anaconda jupyter notebook 运行代码文件:naive bayes.ipynb python环境
2023-11-12 20:53:50 55.11MB 机器学习 python 数据集 朴素贝叶斯算法
1
java编写的贝叶斯网络分类器(贝叶斯算法java版本的代码) JavaBayes-0.346.zip JavaBayes-javadoc-0.346.jar JavaBayes-manual-0.346.ps.gz
2023-11-09 07:05:05 901KB 贝叶斯
1
贝叶斯网络参数学习 课程项目-COL884(Spring'18):人工智能的不确定性 创作者:Navreet Kaur [2015TT10917] 客观的: 警报贝叶斯网络给定数据的贝叶斯参数学习,每行最多有一个缺失值。 使用的算法: 期望最大化 目标: 这项任务的目的是获得学习贝叶斯网络的经验,并了解它们在现实世界中的价值。 设想: 医学诊断。 一些医学研究人员创建了贝叶斯网络,该网络对(某些)疾病和观察到的症状之间的相互关系进行建模。 作为计算机科学家,我们的工作是根据健康记录来学习网络的参数。 不幸的是,在现实世界中,某些记录缺少值。 我们需要尽力计算网络参数,以便以后可以将其用于诊断。 问题陈述: 我们得到了由研究人员创建的贝叶斯网络(如BayesNet.png所示),注意此处对八种诊断进行了建模:血容量不足,左心衰竭,过敏React,镇痛不足,肺栓塞,插管,弯管和断线。
1
这里的文件是: 1- load_data:从csv文件导入数据2- 可视化:打印特征分布的直方图。 在名为可视化的文件夹中的训练数据中的两个类。 3-estimate_:估计给定数据的模型4-classify_:根据模型和数据进行分类5-测试:使用 alpha=1:0.1:1000 测试 Naive 分类器并在可视化文件夹中打印一个名为 (accuracy 1-1000.pdf) 的图6- InspectTheModel:尝试衡量每个类的每个特征值的影响7-jointProb:计算给定一个类的两个给定特征值的联合概率8- 互信息:计算训练数据上的互信息以驱动最可能的依赖特征对。 9- testingBonus:使用候选特征对测试朴素分类器。 要运行演示,请运行testing.m,但是根据需要更改开始,步骤和结束!
2023-05-18 19:50:58 90KB matlab
1
贝叶斯网络可视化工具genie_academic最新版,具有参数学习、结构学习等功能。学术版,请勿用于商业用途。
2023-04-10 15:52:17 15.66MB 贝叶斯网络
1
基于粗糙集理论和贝叶斯网络的电力变压器故障诊断方法
2023-04-06 17:44:06 284KB 基于粗糙集理论和贝叶斯网络
1