提出一种使用朴素贝叶斯作为核心算法来产生自动化测试用例的方法。该方法以实现自动化测试为目标,引入了朴素贝叶斯对产生的随机测试用例分类的思想。实验结果表明,这是一种可行的生成测试用例的方法。
2022-05-14 20:53:18 915KB 自然科学 论文
1
使用sklearn库实现朴素贝叶斯算法。使用词向量算法对文本数据进行处理。 资源内容包括: 1、完整的用于实现新闻分类任务的源码文件(ipynb格式) 2、哈工大停用词表 3、四川大学机器智能实验室停用词表 4、用于测试的新闻数据 贝叶斯定理由英国数学家贝叶斯(Thomas Bayes 1702-1761)发展 用来描述两个条件概率之间的关系 在B条件下A发生的概率: P(A∣B)=P(AB)/P(B) 在A条件下B发生的概率: P(B∣A)=P(AB)/P(A) 则:P(A∣B)P(B) = P(B∣A)P(A) 可导出:P(A∣B)=P(B∣A)P(A)/P(B) 或 P(A∣B) P(B) = P(B∣A)P(A) 贝叶斯公式: P(Y|X)=P(X|Y)P(Y) / P(X) 在机器学习中: X:代表特征向量 Y:代表类别 P(X):先验概率,是指根据以往经验和分析得到的概率。 P(Y|X):后验概率,事情已经发生,这件事情发生的原因是由某个因素引起的可能性的大小 P(X|Y):条件概率,在已知某类别的特征空间中,出现特征值X的概率
2022-05-11 17:06:15 9.82MB 算法 分类 人工智能 机器学习
schnorr-python 椭圆曲线secp256k1上的Schnorr签名。 参考
2022-05-11 00:34:21 6KB Python
1
实验介绍 1.实验内容 本实验包括: 基于朴素贝叶斯算法的言论过滤器 基于朴素贝叶斯算法实现垃圾邮件过滤 2.实验目标 通过本实验掌握朴素贝叶斯算法原理,熟悉朴素贝叶斯算法的简单应用。 【言论过滤器】 实验步骤:【言论过滤器】- 概述 以在线社区留言为例。为了不影响社区的发展,我们要屏蔽侮辱性的言论,所以要构建一个快速过滤器,如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标志为内容不当。过滤这类内容是一个很常见的需求。对此问题建立两个类型:侮辱类和非侮辱类,使用1和0分别表示。
2022-05-10 10:02:50 70KB 机器学习 人工智能
1
基于朴素贝叶斯分类的垃圾词检测 语言go python go get -u 的方式进行安装 EXPLAINATION config.json 服务运行配置文件 SOCK_FILE: 服务以Unix Domain Socket 方式运行的时候sock文件的存放位置 WORKSPACE: 代码根目录,spamcheck.go文件的位置 CLASSES: 分类类别,至少2个。每个分类需要有对应的先验概率词典文件,示例:分类为adwords,则同级目录下需要有adwords.txt,字典越大,服务的分类结果越准确。 DICTIONARYFILE:sego库分类字典,需要手动指定,文件路径为绝对路径;分词准确度可以通过自定义字典进行替换。 SOCKET_BUFFER_SIZE:服务以Unix Domain Socket的方式运行的时候,缓冲区大小,可以根据数据量的大小进行调试。 spamcheck.go: 垃圾词检测主文件 README.md:服务介绍文件 requirements.txt: 项目依赖第三方库列表 *.txt: 根据config.json 中CLASSES 指定的
2022-05-09 11:04:31 7KB 数据挖掘 人工智能 机器学习 go
实现了高斯、多项式、伯努利三种朴素贝叶斯模型,能够处理离散型数据和连续型数据,并提供预测结果概率。对于像鸢尾花这类的连续型数据可以直接采用MyGaussianNB预测。离散型数据采用MyMultinomialNB预测。离散型数据,且特征值只有0,1两种取值情况的采用MyBernoulliNB预测。三种模型都可以通过score方法评估模型准确率,都可以通过predict_proba方法输出预测结果概率。 此外,为了优化和改进模型,使MyMultinomialNB和MyBernoulliNB能够预测连续型数据,还实现了基于numpy和pandas的分箱函数MyDiscretizer以及二值化函数MyBinarizer。
2022-05-04 04:55:43 47KB 人工智能 python 朴素贝叶斯算法
1
四个机器学习实验,主要涉及简单的线性回归、朴素贝叶斯分类器、支持向量机、CNN做文本分类,内附实验指导书、讲解PPT、参考代码 1、实验讲解PPT 4份 实验一 线性回归模型实验指导 实验二 支持向量机模型实验指导 实验三 贝叶斯分类解决西瓜问题 实验四 基于tensorflow实现CNN文本分类 2、实验指导书 4份 实验一 线性回归实验指导书 实验二 支持向量机实验指导书 实验三 贝叶斯分类实验指导书 实验四 基于tensorflow实现cnn文本处理实验指导书 3、实验参考代码 4份 实验一 LinearRegression 实验二 SVM 实验三 bayes_classify_demo 实验四 cnn-text-classification-tf
2022-05-01 12:05:44 4.63MB 机器学习 线性回归 支持向量机 cnn
本资源为机器学习实战的所有源代码。包含的内容有使用k-近邻算法改进约会网站的配对效果、使用k-近邻算法识别手写数字、使用决策树预测隐形眼镜类型、使用朴素贝叶斯过滤垃圾邮件、从疝气病症预测病马的死亡率、SVM手写识别问题回顾、利用AdaBoost元算法提高分类、线性回归预测鲍鱼的年龄、岭回归预测乐高玩具套装的价格、树回归、K-means对地理坐标进行聚类、Apriori算法发现毒蘑菇的相似特征、FP-growth算法从新闻网站点击流中挖掘、PCA对半导体制造数据降维、SVD基于协同过滤的推荐引擎、分布式SVM的Pegasos算法、用mrjob实现MapReduce版本的SVM。’
2022-04-30 13:06:16 12.72MB 机器学习 决策树 回归 支持向量机
面向语义的文本分类是指在给定的分类体系下,根据文本的内容自动识别文本类别的过程。是一种基于朴素贝叶斯算法的分类技术应用与中文短文本分类。
2022-04-29 14:58:40 714KB 短文本 分类 朴素贝叶斯
1
贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。其分类原理就是利 用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率的类作为该特征所属的类。之所以称之为”朴素”,是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是统计独立的。 朴素贝叶斯法(Naive Bayes model)是基于贝叶斯定理与特征条件独立假设的分类方法。 最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响
2022-04-27 16:05:48 1.46MB 算法 机器学习 数据结构 人工智能
1