关于朴素贝叶斯分类算法的改进.pdf
2022-07-11 09:11:34 1.22MB 文档资料
什么是机器学习分类算法?【K-近邻算法(KNN)、交叉验证、朴素贝叶斯算法、决策树、随机森林】.doc
2022-07-09 19:05:02 1.75MB 技术资料
朴素贝叶斯学习笔记完整版
2022-07-08 15:07:26 1.44MB 学习笔记 朴素贝叶斯 代码
1
010朴素贝叶斯.7z010朴素贝叶斯.7z
2022-07-02 10:00:37 8.18MB 010朴素贝叶斯.7z
1.对微博的高校舆情话题进行爬取并保存,内容包括用户名、发布时间、发布内容、点赞数、评论数、转发数。 2.对爬取的信息进行去重和预处理,去掉爬取到的内容相同的博文,并将博文内容中的话题、用户名过滤掉,以便进行词频统计。 3.对经过预处理的数据进行分词和词频统计,生成词云图。 4.先对五百多条数据进行人工标记作为训练集,再将所有数据都进行标记以便计算准确率,随后运行程序对所有数据进行贝叶斯情感倾向分析,根据分析结果和人工标记结果进行对比,计算准确率。 5.对实验方法进行分析和改进,或提出改进方案。 包含源码:爬虫+分词+数据预处理+词云+朴素贝叶斯情感倾向分析+可视化结果显示
2022-07-01 21:03:39 10.81MB 机器学习 情感倾向分析 高校舆情
python朴素贝叶斯完整代码,数据以及结果图片
2022-06-19 19:29:53 21KB python 朴素贝叶斯算法
1
机器学习课设大作业基于BERT和朴素贝叶斯算法的新闻文本分类项目(源码+大作业+数据集)。一个很完整的项目源码,操作没难度,新手也可放心下载。 data文件夹中已经包括了初始的数据集和处理之后的数据集。.csv文件初始数据集,另外两个是经过News_prediction.ipynb代码处理过的。在Bert和NaiveBayes训练函数中直接加载上来。 result文件夹中的文件是朴素贝叶斯和Bert模型训练后的输出文件 互联网假新闻分类 一共三种类别:真新闻、假新闻、不用判断 40000条训练文本数据,10000条测试数据。 基于正则表达式和Jieba完成特征工程 朴素贝叶斯:tf-idf词嵌入。87.4% BERT:cn-wmm预训练词向量。5-epoch,91.4%
k-means 聚类算法 的朴素julia实现_julia_代码_下载
2022-06-10 09:06:47 31.86MB julia 算法
朴素贝叶斯分类算法做中文文本分类-附件资源
2022-06-10 09:03:29 23B
1
朴素贝叶斯估计 朴素贝叶斯是基于贝叶斯定理与特征条件独立分布假设的分类方法。首先根据特征条件独立的假设学习输入/输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。 具体的,根据训练数据集,学习先验概率的极大似然估计分布 以及条件概率为 Xl表示第l个特征,由于特征条件独立的假设,可得 条件概率的极大似然估计为 根据贝叶斯定理 则由上式可以得到条件概率P(Y=ck|X=x)。 贝叶斯估计 用极大似然估计可能会出现所估计的概率为0的情况。后影响到后验概率结果的计算,使分类产生偏差。采用如下方法解决。 条件概率的贝叶斯改为
2022-06-06 02:13:44 92KB python python for循环
1