python爬虫,以及相似度分析,可以分析两个文本字符串的相似度
2019-12-21 22:22:18 29KB python 爬虫 相似度分析
1
用于中文文本分词,去停用词,包含基本的停用词词典,可根据需要进行扩充。
2019-12-21 21:27:47 7KB 中文分词 去停用词
1
数据挖掘,pyton3.6文本分类
2019-12-21 21:20:15 849KB 文本分类
1
使用前一定要看使用说明,本程序批量下载excel中的文件链接并自动命名写入excel ,解决了遇到批量的链接时,用迅雷下载会遇到文件名无法统计的问题,本程序可以做到下载文件名与下载链接一一对应,写入excel。
2019-12-21 20:32:31 20.25MB python 文本批处理 自动下载 大数据采集
1
该资源主要参考我的博客: [python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 http://blog.csdn.net/eastmount/article/details/50545937 包括输入文档txt,共1000行数据,每行都是分词完的文本。 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中的K-means进行文本聚类; 3.使用PAC进行降维处理,每行文本表示成两维数据; 4.最后调用Matplotlib显示聚类效果图。 免费资源,希望对你有所帮助~ By Eastmount
2019-12-21 19:41:38 247KB python 文本聚类 Kmeans 降维
1
Text Processing In Python英文版by David Mertz。 简单就是最好,本电子书只有文本文件。
2009-12-21 00:00:00 1.35MB Text Processing Python
1