基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程,免积分下载版
程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到
F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\
下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录,
停用词表也放在"F:/DataMiningSample/目录下,即可运行eclipse工程。程序
会依次执行数据预处理、贝叶斯分类、KNN分类,输出10次交叉验证实验的分类
结果、准确率统计及混淆矩阵。
1