上传者: 42127783
|
上传时间: 2021-11-06 15:58:24
|
文件大小: 365KB
|
文件类型: -
在之前的实验中,我使用朴素贝叶斯(Naive Bayes)对此垃圾邮件进行分类。 在本笔记本中,我们将通过使用一些新技术(例如Bagging,RandomForest和AdaBoostClassifier)扩展先前的分析。
事实证明,我们的朴素贝叶斯模型实际上做得很好。 但是,让我们看一下其他一些模型,看看是否仍然无法改进。
特别是在本笔记本中,我们将研究以下技术:
可以找到有关合奏方法的另一个非常有用的指南。
这些合奏方法结合了多种技术:
引导通过学习者传递的数据(装袋)。
对用于学习者的功能进行子集化(与装袋组合表示随机森林的两个随机组成部分)。
将学习者聚集在一起,以使在某些方面表现最佳的学习者产生最大的影响(增强)。
通常,可以使用五步过程来使用监督学习方法(您在上面实际使用的方法):
导入模型。
使用感兴趣的超参数实例化模型。
使模型适合训练数据。
预测测