nlp_windows_exe_ui 介绍 python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键字提取,文本分类;由于要打包成exe的关系,我将原本的项目的多一个文件的集成到一个python文件(合并文件)里,只保留了使用该系统所需要的函数,方便打包,通俗地讲就是,生成生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据) 运行这个系统需要数据支持,所以请合并像我这样将所要使用的数据跟exe放在同一个文件夹下,否则运行不了。 软件架构 系统实现: 分词:使用jieba中文分词(去中断词,精确模式); 词性标注:使用jieba库里的posseg包进行词性标注; 关键词:基于lda模型结合tfidf的最合适的前六个词; 文本分类:给
2022-04-01 15:10:34 20.28MB nlp Python
1
数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合 有各种类别,适合文本分类,,
2022-03-31 21:10:45 13.99MB 分类数据集
1
20news-bydate.tar.gz 文本分类 数据集 20news
2022-03-31 15:36:35 13.79MB 文本分类
1
中文文本分类停用词1208个中文文本分类停用词1208个中文文本分类停用词1208个
2022-03-30 11:47:56 3KB 停用词
1
文本分类现状和应用
2022-03-29 23:11:14 305KB 文本分类 综述 报告
1
利用tensorflow的中文文本分类程序,包括CNN和RNN实现,程序结构清晰,便于学习理解。
2022-03-29 22:57:55 410KB 中文文本分类 CNN tensorflow
1
图模型在机器学习有着广泛的应用。相比图模型,Sum-Product Networks模型具有更强表达能力和更快的推理速度,所以其在对文本和图像数据建模有着广泛的应用。本文总结Sum-Product Networks这一新的深度概率模型的研究进展,先介绍了固定结构的Sum-Product Networks的参数学习方法,再介绍了根据不同的输入数据而进行的结构和参数学习方法。并且介绍了判别式和生成模型的Sum-Product Networks,最后介绍了Sum-Product Networks在文本分类上的应用。
1
采用XML做数据库存储样本特征库,进行样本训练,可以直接加载词典后进行分本分类。也可以清空样本库,重新选择样本库进行训练
2022-03-29 14:43:53 114KB 贝叶斯-KNN,文本分类
1
文本分类模型 在Pytorch中实现最新的文本分类模型 实施模型 fastText:fastText模型, TextCNN:提出的用于文本分类的CNN TextRNN:用于文本分类的双向LSTM网络 RCNN:在提出的的RCNN模型的实现 CharCNN: 提出的字符级CNN的实现 带有注意力的Seq2seq :,从注意实现seq2seq模型 变压器:提出的变压器模型的实现 要求 Python-3.5.0 熊猫0.23.4 Numpy-1.15.2 Spacy-2.0.13 Pytorch-0.4.1.post2 火炬文字-0.3.1 用法 将数据下载到“ data /”目录中或使
2022-03-28 10:27:15 12.48MB nlp deep-learning pytorch recurrent-neural-networks
1
用于生成训练语料,供文本分类器使用。在控制台操作,简单易用
2022-03-26 22:12:59 8KB 文本分类 训练语料
1