对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2024-04-27 12:01:07 685KB
1
使用python对51job的招聘信息进行爬虫,使用python对职位信息输出词云,词频统计图,使用jieba库进行分词,然后使用gensim的word2vec进行词向量训练,然后使用sklearn的k-means算法进行聚类。压缩包内有代码,数据,简单的小论文文档,代码来源于网络,论文自己写的,水平一般。代码在anaconda的spyder开发环境可以正常运行。
2022-02-19 21:55:10 2.02MB python爬虫 词云 词向量 K-means文本聚类
1
一个简单的K-means文本聚类Java实现,可以让你了解怎样去实现一个自己的文本聚类方法
2022-02-01 11:36:44 9KB K-means 文本聚类 Java实现
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2022-01-07 10:25:16 685KB 5.1
1
文本聚类 文本聚类的一种实现,使用 k-means 进行聚类,并使用作为距离度量。 等等,什么? 基本上,如果您有一堆文本文档,并且您想按相似性将它们分成 n 个组,那么您很幸运。 例子 为了测试这一点,我们可以查看test_clustering.py : from vectorizer import cluster_paragraphs from random import shuffle text1 = """Type theory is closely related to (and in some cases overlaps with) type systems, which are a programming language feature used to reduce bugs. The types of type theory were created to avo
2021-11-08 17:54:02 9KB Python
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料亲测可用, 谢谢支持。
2021-10-12 15:33:25 685KB 5.1
1
用C#实现的k均值文本聚类算法,已经调试通过
2021-08-26 18:31:14 37KB k均值 k-means 文本聚类 分类
1
基于叙词表的K-means文本聚类修正方法.pdf
2021-08-20 14:13:10 355KB 聚类 算法 数据结构 参考文献
k-means中文文本聚类java源码,包括对文本tf,idf的计算,文本相似度计算
2021-06-19 03:03:28 9KB lk-means 聚类 java 源码
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2021-05-15 10:18:56 685KB 5.1
1