采用XML做数据库存储样本特征库,进行样本训练,可以直接加载词典后进行分本分类。也可以清空样本库,重新选择样本库进行训练
2022-03-29 14:43:53 114KB 贝叶斯-KNN,文本分类
1
本文用C++实现KNN分类算法,代码齐全,直接使用,很适合初学者学习之用
2021-11-30 19:34:56 42KB c++
1
针对文本自动分类问题,提出了一种基于LSA降维的KNN改进算法。通过对文本特征向量运用LSA理论进行降维处理,可以有效提高KNN算法的运行效率,提高分类精度。实验证明,改进的KNN算法具有很好的性能。
2021-10-20 17:42:00 532KB 自然科学 论文
1
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-06-25 09:04:28 15KB 分词算法 KNN文本分类算法 python
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-05-13 10:48:42 15KB KNN NLP 正向最大匹配分词 文本分类
1