基础的lda文本挖掘python实现过程,亲测无误。缺少主题个数的推导。
2019-12-21 21:12:35 3KB ld gensi
1
直接把解压后的文档里的gensim文件放进python27下 的lib库里
2019-12-21 21:10:08 2.16MB python
1
包括Python分词,去停用词,使用gensim包进行LDA主题分析,并输出每条矩阵属于每个主题的概率的代码,以及停用词表
2019-12-21 21:06:45 7KB gensim LDA主题分析 概率矩阵
1
gensim包的tfidf方法计算中文文本相似度,代码可直接运行,包含中文停用词,方便。
2019-12-21 20:39:02 52KB gensim tfidf 中文相似度
1
python的gensim最新包,windows下安装python setup.py install
2019-12-21 20:21:21 22.08MB python包
1
Gensim是一个易学易用的机器学习工具包,基于Python,主打topic model,当然也包含其它NLP中常用模型(如LSA、word2vec等)。此文档是笔者基于gensim官网所提供教程翻译而来,限于水平,难免有纰漏,望读者不吝指正,谢谢!
2019-12-21 18:55:48 1.22MB gensim 官方教程 中文版
1