基于tensorflow+CNN的搜狐新闻文本分类-附件资源
2021-12-25 18:06:27 106B
1
数据挖掘:基于朴素贝叶斯定理的文本分类实践(Java)
2021-12-25 13:29:08 17KB 朴素贝叶斯 文本分类 数据挖掘 Java
1
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明来源(复旦大学计算机信息与技术系国)
2021-12-24 15:11:46 52.33MB 文本分类 语料
1
基于文本分类的信息检索模型,丁志刚,王小捷,本文探索了如何利用信息文本分类对检索系统结果进行改善。首先,根据特定的分类集分别对待检索文档和检索条件进行数据建模;讨论
2021-12-24 12:37:17 277KB 信息检索
1
基于tensorflow+CNN的报警信息短文本分类-附件资源
2021-12-23 16:08:17 23B
1
有搜狗分类新闻语料库得出的libsvm格式数据,特征词选择方法为IG,更多了解请参阅个人博客http://hi.baidu.com/finallyliuyu/home 查阅相关文章
2021-12-22 11:26:12 8.72MB libsvm数据
1
通过对数据进行分词、停词过滤、TfidfVectorizer/CountVectorizer处理,利用sklearn中是逻辑回归对THUCNews进行分类,包含数据集
2021-12-22 09:33:22 48.44MB NLP 逻辑回归 文本分类 sklearn
1
KNN算法是比较适合于文本分类的一种分类算法,但由于其计算复杂度会随着训练集规模的增加而线性增加,从而限制了它的实际应用效果.通过改变对近邻点的搜索策略,提出了一种改进型的KNN算法.该算法在对最近邻的选择过程中,放弃传统算法中遍历所有样本的做法,而是通过逐渐逼近的思想来寻找最近邻点.实验证明,该方法在保持和传统的 KNN算法几乎一样的精度性能前提下,可以明显降低算法的计算复杂度,降低时间开销,取得了较满意的结果.
2021-12-19 22:47:33 978KB 自然科学 论文
1
中文自然语言处理文本分类语料,共15个分类,类别包括财经、电竞、房产、国际、教育、军事、科技、旅游、民生、农业、汽车、体育、文化、娱乐、证券
2021-12-19 16:01:45 64.98MB nlp 机器学习 自然语言处理
1
文字分类器 此仓库是基于Tensorflow2.3的文本分类任务,分别支持: 随机初始单词嵌入+ TextCNN 随机初始词嵌入+注意+ TextCNN 随机初始单词嵌入+ TextRCNN Word2Vec + TextCNN Word2Vec +注意+ TextCNN Word2Vec + TextRCNN 伯特嵌入(没有微调,直接取向量)+ TextCNN Bert嵌入(没有微调,直接取向量)+ TextRCNN 代码支持二分类和多分类,此项目基于爬取的游戏评论正是个二元的情感分类作为演示。 环境 python 3.6.7 张量流== 2.3.0 gensim == 3.8.3 杰巴== 0.42.1 sklearn == 0.0 其他环境见requirements.txt 更新历史 日期 版本 描述 2018-12-01 v1.0.0 初始仓库 2020-10-
2021-12-19 13:33:47 65.45MB word2vec textcnn textrcnn tensorflow2
1