java实现的文本分类程序
2019-12-21 22:18:15 17.96MB 文本分类
1
本程序实现了基于朴素贝叶斯方法的文本分类,附有源代码、实验报告、可执行程序以及语料库(包括训练集和测试集)
2019-12-21 22:17:52 1.78MB 朴素贝叶斯 文本分类 Naive Bayes
1
这是一个文本分类的语料库,主要是用于文本分类,主旨句提取,关键词提取等等应用。
2019-12-21 22:15:30 158KB 文本分类;语料库;主旨句;
1
NLPCC2014 微博情感分析样例数据。数据集以xml格式储存,包含情感类别,keypression。sentiment classification
2019-12-21 22:14:03 13.6MB 情感分析 微博 文本分类
1
多算法文本分类器,功能强大,界面简洁,自带帮助方便应用学习研究
2019-12-21 22:13:24 8.63MB 文本 分类
1
利用python,实现基于SVM的文本分类. 代码见 https://github.com/yangysc/Document-Classification
2019-12-21 22:09:06 314KB python SVM 文本分类
1
基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程 程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到 F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\ 下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录, 停用词表也放在"F:/DataMiningSample/目录下,即可运行eclipse工程。程序 会依次执行数据预处理、贝叶斯分类、KNN分类,输出10次交叉验证实验的分类 结果、准确率统计及混淆矩阵。
1
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21 101.81MB 文本分类 数据集 复旦 中文
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2019-12-21 22:00:56 71KB 分词 去停用词 词频计算
1
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
2019-12-21 21:59:17 26.06MB 文本分类
1