20news-bydate.tar.gz 文本分类 数据集 20news
2022-05-18 16:43:27 13.79MB 文本分类 数据集 20news
1
因课程做的基于马尔科夫逻辑网实现的文本分类,使用了基于Markov逻辑表示的处理平台Alchemy、开源全文索引引擎工具包Lucene,适合相关入门人员。文件夹里有课程报告、JAVA代码、及相关说明。一直以来受益于互联网资源分享,以此作为反馈的开始。
2022-05-18 15:41:24 5.43MB Alchemy IKAnalyzer Lucene
1
文本分类中地特征提取和分类算法综述.pdf
2022-05-17 09:01:07 379KB 分类 文档资料 数据挖掘 人工智能
中文情感分析的实质是文本分类问题,本项目分别采用CNN和BI-LSTM两种模型解决文本分类任务,并用于情感分析,达到不错的效果。 两种模型在小数据集上训练,在验证集的准确率、号回率及F1因子均接近90% 项目设计的目标可以接受不同语料的多种分类任务,只要语料按照特定格式准备好,就可以开始调参训练、导出、serving。
2022-05-15 16:06:36 73.22MB 情感分析 文本分类 深度学习
人工智能-项目实践-文本分类-CNN-RNN中文文本分类,基于TensorFlow 使用卷积神经网络以及循环神经网络进行中文文本分类 CNN做句子分类的论文可以参看: Convolutional Neural Networks for Sentence Classification 以及字符级CNN的论文:Character-level Convolutional Networks for Text Classification 本文是基于TensorFlow在中文数据集上的简化实现,使用了字符级CNN和RNN对中文文本进行分类,达到了较好的效果。 文中所使用的Conv1D与论文中有些不同,详细参考官方文档:tf.nn.conv1d
2022-05-13 09:08:46 410KB 文档资料 cnn rnn tensorflow
基于TensorFlow、CNN、清华数据集THUCNews的字符级卷积神经网络实现文本分类算法源码
2022-05-12 19:02:06 48.72MB tensorflow 源码软件 cnn 分类
1
个人博客word2vec文本分类使用的数据集,附带了停用词
2022-05-11 22:06:43 2.38MB 分类 文档资料 数据挖掘 人工智能
1
情感分析 它是一种文本分类,可在IMDB大电影评论数据集上训练递归神经网络(RNN)以进行情感分析。
2022-05-10 20:50:33 5KB JupyterNotebook
1
TextRecommended TF-IDF SVM文本分类实现 实现了三个分词接口 IK Jeseg Stanford 还是觉得Jeseg最好,自定义的空间也大 特征选取是用CHI2 语料库是搜狗
2022-05-08 19:41:43 396KB Java
1
短文本分类是自然语言处理的一个研究热点.为提高文本分类精度和解决文本表示稀疏问题,提出了一种全新的文本表示(N-of-DOC)方法.采用Word2Vec分布式表示一个短语,将其转换成的向量作为卷积神经网络模型的输入,经过卷积层和池化层提取高层特征,输出层接分类器得出分类结果.实验结果表明,与传统机器学习(K近邻,支持向量机,逻辑斯特回归,朴素贝叶斯)相比,提出的方法不仅能解决中文文本向量的维数灾难和稀疏问题,而且在分类精度上也比传统方法提高了4.23%.
1