使用python实现中文文本聚类,利用kmeans算法,包含jiba分词方法等
2019-12-21 20:34:55 5.32MB python 中文文本聚类 kmeans
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2019-12-21 20:11:58 685KB 5.1
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料亲测可用, 谢谢支持。
2019-12-21 20:11:25 685KB 5.1
1
信息检索中文本聚类的实现 java代码编写
2019-12-21 20:09:13 1.59MB 信息检索 文本聚类
1
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37 9KB kmeans 中文 文本聚类 tf
1
测试用的文本聚类程序,使用的是kmeans算法进行聚类。
2019-12-21 19:45:09 1.59MB 聚类 数据挖掘 Cluster kmeans
1
该资源主要参考我的博客: [python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 http://blog.csdn.net/eastmount/article/details/50545937 包括输入文档txt,共1000行数据,每行都是分词完的文本。 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中的K-means进行文本聚类; 3.使用PAC进行降维处理,每行文本表示成两维数据; 4.最后调用Matplotlib显示聚类效果图。 免费资源,希望对你有所帮助~ By Eastmount
2019-12-21 19:41:38 247KB python 文本聚类 Kmeans 降维
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2019-12-21 19:38:23 685KB K-Means
1
程序利用中科院的软件,分词、词性标注以后聚类,利用tf-idf值求出30个特征性,生成特征向量,可放在weka中聚类!
2019-12-21 19:28:15 5.25MB 中文分词、词性标注,聚类
1
使用JAVA编写的,分词、TFIDF相似度计算,K临近法聚类
2019-12-21 19:23:29 10KB JAVA TFIDF计算 K临近聚类
1