基于深度学习的新闻文本分类算法的研究与实现,张维,何所惧,文本分类属于自然语言处理领域一个非常典型的问题,应用普遍。使用深度学习算法处理文本分类任务可以避免繁杂的人工特征工程,但
2021-05-15 19:08:06 541KB 文本分类
1
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-05-13 10:48:42 15KB KNN NLP 正向最大匹配分词 文本分类
1
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征选择算法(训练集特征选择)。
2019-12-21 19:36:01 3.9MB Hadoop 文本分类 朴素贝叶斯 TF
1
基于LDA文本分类的python实现版本
2019-12-21 18:57:42 70KB LDA 文本分类 python
1