文本挖掘是数据挖掘领域中一个热门的研究方向。在文本挖掘领域中,文本聚类技术有助于缩小数据搜索空间,提高查询精度。作为一种无监督的机器学习方法,文本聚 类技术己经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。可以说,文本聚类的研究具有重要的理论意义和实际使用价值。自组织特征映射神经网络SOM在聚类应用中具有自组织映射、可视化好、计算效率高、聚类效果好等良好特性。因此,本文将SOM神经网络应用到中文文本聚类中,研究其在文本聚类中的有关特性。
2022-01-05 16:51:50 4.66MB 神经网络 SOM 聚类算法
1
基于语义簇的中文文本聚类算法.pdf
2021-08-19 09:23:03 1.16MB 聚类 算法 数据结构 参考文献
使用python实现中文文本聚类,利用kmeans算法,包含jiba分词方法等
2019-12-21 20:34:55 5.32MB python 中文文本聚类 kmeans
1
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37 9KB kmeans 中文 文本聚类 tf
1