朴素贝叶斯(二)文本分类朴素贝叶斯的一般流程用python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:朴素贝叶斯分类函数文档词袋模型 朴素贝叶斯的一般流程 (1)收集数据:任何方法 (2)准备数据:数值型、布尔型 (3)分析数据:特征多,用直方图效果好 (4)训练算法:计算不同的独立特征的多条件概率 (5)测试算法:计算错误率 (6)使用算法:一般应用于文档分类,也可以在任意分类场景 用python进行文本分类 以在线社区留言板为例,构建快速过滤器,判断是否是侮辱性言论。用1和0分别表示。 准备数据:从文本中构建词向量 #创建一些实验样本 def loadDat
2021-12-29 13:15:51 49KB 分类 学习 实战
1
数据挖掘:基于朴素贝叶斯定理的文本分类实践(Java)
2021-12-25 13:29:08 17KB 朴素贝叶斯 文本分类 数据挖掘 Java
1
用c++编写的朴素贝叶斯算法,包含零概率处理,数据已在程序中初始化
2021-12-25 04:31:04 59KB 朴素贝叶斯 c++
1
实际应用中大量的不完整的数据集,造成了数据中信息的丢失和分析的不方便,所以对缺失数据的处理已经成为目前分类领域研究的热点。由于EM方法随机选取初始代表簇中心会导致聚类不稳定,本文使用朴素贝叶斯算法的分类结果作为EM算法的初始使用范围,然后按E步M步反复求精,利用得到的最大化值填充缺失数据。实验结果表明,本文的算法加强了聚类的稳定性,具有更好的数据填充效果。
2021-12-23 12:00:20 404KB 软件
1
生物神经系统的六个基本特征: 1)神经元及其联接; 2)神经元之间的联接强度决定信号传递的强弱; 3)神经元之间的联接强度是可以随训练改变的; 4)信号可以是起刺激作用的,也可以是起抑制作用的; 5)一个神经元接受的信号的累积效果决定该神经元的状态; 6) 每个神经元可以有一个“阈值”。 8.3 人工神经网络 8.3.1 生物神经元
1
根据人名预测性别_基于多项式的朴素贝叶斯算法实现. 手工实现了一个基于贝叶斯算法的文本分类(二分类) 里面有两个案例,有一个案例有手工计算的过程,用于佐证算法实现的准确性的,另一个是一个小竞赛中的题目,用名字预测性别.
2021-12-19 17:04:38 1.25MB 朴素贝叶斯 人名预测性别 多项式 python
1
https://blog.csdn.net/bo_hai/article/details/108870754 文中用到的数据集
2021-12-19 10:59:21 9.13MB 机器学习 朴素贝叶斯算法
1
有关机器 学习的基本介绍,比如机器学习是分为监督学习和无监督学习的,以及监督学习中的一些算法,有分类算法和数值型预测算法,分类算法中几种比较经典的算法
1
基本ML算法 最近邻居 逻辑回归 线性回归 朴素贝叶斯 K均值聚类
2021-12-15 22:34:33 1.89MB JupyterNotebook
1
《机器学习》算法实例-朴素贝叶斯算法-屏蔽社区留言板的侮辱言论 构建一个快速过滤器来屏蔽在线社区留言板上的侮辱性言论。如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标识为内容不当。对此问题建立两个类别: 侮辱类和非侮辱类,使用 1 和 0 分别表示。 提取所有文档中的词条并进行去重 获取文档的所有类别 计算每个类别中的文档数目 对每篇训练文档: 对每个类别: 如果词条出现在文档中-->增加该词条的计数值(for循环或者矩阵相加) 增加所有词条的计数值(此类别下词条总数) 对每个类别: 对每个词条: 将该词条的数目除以总词条数目得到的条件概率(P(词条|类别)) 返回该文档属于每个类别的条件概率(P(类别|文档的所有词条))
2021-12-15 17:10:29 2.94MB 机器学习 朴素贝叶斯算法 算法
1