上传者: 38705723
|
上传时间: 2021-12-29 13:15:51
|
文件大小: 49KB
|
文件类型: -
朴素贝叶斯(二)文本分类朴素贝叶斯的一般流程用python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:朴素贝叶斯分类函数文档词袋模型
朴素贝叶斯的一般流程
(1)收集数据:任何方法
(2)准备数据:数值型、布尔型
(3)分析数据:特征多,用直方图效果好
(4)训练算法:计算不同的独立特征的多条件概率
(5)测试算法:计算错误率
(6)使用算法:一般应用于文档分类,也可以在任意分类场景
用python进行文本分类
以在线社区留言板为例,构建快速过滤器,判断是否是侮辱性言论。用1和0分别表示。
准备数据:从文本中构建词向量
#创建一些实验样本
def loadDat