文本分类技术经历了从专家系统到机器学习再到深度学习的发展过程。在20世纪80年代以前,基于规则系统的文本分类方法需要领域专家定义一系列分类规则,通过规则匹配判断文本类别。
2021-02-23 11:08:23 1.34MB 深度学习 文本分类
1
针对中文文本的自动分类问题,提出了一种逆向匹配算法。该算法的基本思路是构造一个带权值的分类主题词表,然后用词表中的关键词在待分类的文档中进行逆向匹配,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
1
官网glove.6B的词向量,里面包含了50d、100d、200d、300d常用英文单词的词向量,来源于wiki百科和Gigaword数据集。
2021-02-17 17:06:59 822.37MB NLP 自然语言处理 机器学习 文本分类
1
文本分类训练与测试语料,详情见 博客《《自然语言处理实战入门》文本分类 ---- 使用词向量与SVM 进行文本分类》:https://season.blog.csdn.net/article/details/113798565
2021-02-16 09:01:42 95.36MB NLP 文本分类
1
在Keras中实现的文本分类模型,包括:FastText,TextCNN,TextRNN,TextBiRNN,TextAttBiRNN,HAN,RCNN,RCNNVariant等。
2021-02-13 20:22:29 1.35MB Python开发-机器学习
1
台湾大学中文情感极性词典(NTUSD)
2021-02-11 20:07:28 43KB NLP 自然语言处理 文本分类 情感分析
1
知网情感词典(HOWNET)
2021-02-11 20:07:28 94KB NLP 自然语言处理 情感分类 文本分类
1
bosonnlp情感词库,来源于社交媒体文本,适用于处理社交媒体的情感分析
2021-02-11 20:07:27 1.01MB 自然语言处理 NLP 文本分类 情感分析
1
针对现在机器学习的文本分类算法普遍使用的knn,支持向量机,神经网络等算法进行分类中存在的两个问题,没有考虑到语义关联对其文本的影响和受文章长短对其词频向量大小的影响,通过结合apiori算法进行改进knn算法的方法对文本分类样本进行了分类实验,结果表明,该改进算法相对于为改进前平均查准率有10%左右的提升,平均召回率有5%左右的提升,得出该方法能有效提高文本分类准确率的结论。
2021-01-29 11:13:42 901KB 文本分类;knn;关联规则;apiori
1
A brief overview of text classification algorithms is discussed. This overview covers different text feature extractions, dimensionality reduction methods, existing algorithms and techniques, and evaluations methods.
2021-01-28 04:54:51 7.2MB 文本分类 综述 算法 机器学习