spark+java实现朴素贝叶斯,文件格式是parquet格式,备注也详细
2021-05-23 21:58:18 2KB 大数据
1
P(X|Y) = P(X,Y)/P(Y) (条件概率)->P(X,Y) = P(X|Y)P(Y)->P(X,Y) = P(Y|X)P(X)->P(X|Y) = P(Y|X)P(X)/P(Y), p(yi|X) = P(yi)p(X|yi)/P(X) 其中P(X)为常数 p(yi|X) = P(yi)p(X|yi) p(yi|X)->某特征下是某类别的概率 P(yi)-> 先验概率(策略:最大似然估计) 某类别下该特征总数/该类别总数 p(X|yi)->某类别下出现某特征概率 前提:独立同分布
1
实验描述: 对指定数据集进行分类问题的分析,选择适当的分类算法,编写程序实现,提交程序和结果报告 数据集: balance-scale.data(见附件一) ,已有数据集构建贝叶斯分类器。 数据包括四个属性:五个属性值 第一个属性值表示样本的类别号,其他四个属性为四个不同的特征值。
2019-12-21 20:35:06 19KB 贝叶斯分类器
1