利用TF-IDF策略的中文文本分类算法比较,刘昕玥,王敬,本文基于TF-IDF特征选取方法,分别使用朴素贝叶斯、随机森林与支持向量机算法对中文文本语料库进行分类实验。实验表明,支持向量机
2022-02-24 20:56:18 538KB 首发论文
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2022-02-22 13:58:59 70KB 词频计算
1
本资源附有配套的7篇博客辅助讲解。 教程博客地址为:https://blog.csdn.net/qq_43592352/article/details/122960985 代码架构强,非常易于理解。 代码拓展性强,方便移植使用自己的数据集、模型。 代码主要采用pytorch实现。
2022-02-21 09:28:58 50.48MB pytorch 神经网络 分类 机器学习
tensorflow + fasttext 实现文本分类及原理-附件资源
2022-02-14 15:14:36 106B
1
在文本分类中,基于Word2Vec词向量的文本表示忽略了词语区分文本的能力,设计了一种用TF-IDF加权词向量的卷积神经网络(CNN)文本分类方法.新闻文本分类,一般只考虑正文,忽略标题的重要性,改进了TF-IDF计算方法,兼顾了新闻标题和正文.实验表明,基于加权词向量和CNN的新闻文本分类方法比逻辑回归分类效果有较大提高,比不加权方法也有一定的提高.
1
使用MIMIC-IV中的影像报告数据,基于pytorch搭建transformer神经网络,使用gensim的word2vec包训练词向量配合pytorch使用,进行英文影像报告的分类。 更加详细的资源介绍参见https://blog.csdn.net/weixin_46523923/article/details/122644174
2022-01-25 09:14:20 2.96MB pytorch word2vec transformer python
华为云——ModelArts-智能文本分类测试 华为云文本分类测试文档.txt
2022-01-23 09:15:22 3.29MB 华为 分类 数据挖掘 人工智能
1
LSTM/CNN网络实现新闻文本分类Jupter源代码,下载后可以在Jupter下直接运行。 包括词向量表,单词词典,jupter源代码
2022-01-19 16:38:39 30.73MB LSTM CNN 文本分类 Jupter
1
文本分类语料,共9833篇文档;train为训练语料,test为测试语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分;
2022-01-17 14:16:20 105.11MB 复旦 文本分类 语料 文本分类语料
1
贝叶斯文本分类实用完整C++代码,超详细注释,有完整的训练和测试数据,有数据转成文本向量的python工具代码,代码在VC6上测试运行无误,能够得到正确的运行效果。。本人课程设计,倾情奉献!
2022-01-15 20:22:26 1.27MB 贝叶斯算法 文本分类 实例
1