上传者: wszhou1997
|
上传时间: 2021-11-09 16:25:15
|
文件大小: 593KB
|
文件类型: -
1. 实验数据在bayes_datasets文件夹中。其中,
train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档;
Bayes_datasets/test为测试数据集,包含若干hotel类文档和travel类文档。
2. 用朴素贝叶斯算法对上述两类文档进行分类。要求输出测试数据集的文档分类结果,即每类文档的数量。