新闻分类
根据新闻标题将新闻分类。 尝试了各种分类器-决策树,支持向量分类器,多项朴素贝叶斯分类器,多层感知器,随机森林。 多项式朴素贝叶斯分类器效果最好。 即使我们人类根据关键字进行分类,多项式朴素贝叶斯算法也能发挥最佳效果,这是合乎逻辑的。 我们很可能会预测“政治”,因为我们会看到诸如奥巴马,大选,共和国之类的关键词;如果我们看到诸如毒品,监狱之类的关键词,我们可能会预测“犯罪”。 朴素贝叶斯扫描整个数据集,并找到标题中每个单词与某个类别相关联的概率,然后找到整个标题的概率,因此效果很好。
安装
pip install numpy pip install scikit-learn pip
1