主题挖掘LSA方法与LDA对比实验数据集,数据集使用请参考文章https://blog.csdn.net/qq_39381654/article/details/107981106
2021-11-11 19:00:31 17MB 机器学习 LDA LSA 新闻主题挖掘
1
一种基于非梯度下降的参数优化算法,2015年提出
2021-10-22 22:04:50 6KB 算法 参数优化
1
针对文本自动分类问题,提出了一种基于LSA降维的KNN改进算法。通过对文本特征向量运用LSA理论进行降维处理,可以有效提高KNN算法的运行效率,提高分类精度。实验证明,改进的KNN算法具有很好的性能。
2021-10-20 17:42:00 532KB 自然科学 论文
1
这是一个简单的文本分类示例,其中使用了用Python编写的潜在语义分析(LSA)并使用了scikit-learn库。 该代码与我在撰写的LSA教程博客文章一起提供。 脚步: [可选]:运行getReutersTextArticles.py下载Reuters数据集并提取原始文本。 已经为您执行了此步骤,并且数据集存储在“数据”文件夹中。 运行runClassification_LSA.py将LSA应用于数据集,然后测试分类准确性。 运行inspect_LSA.py可以深入了解LSA在做什么。
2021-10-15 19:16:40 2.94MB Python
1
在传统的文本信息处理中,以单词向量表示文本的语义内容,以单词向量空间的度量来表示文本之间的语义近似度。这种方法不能准确表示语义。 潜在语义分析试图从大量的文本数据中发现潜在的话题,以话题向量来表示文本的语义内容,以话题向量的空间度量更准确地表示文本之间的语义相似度。 潜在语义分析使用的是非概率的话题分析模型,具体来说,就是将文本集合表示为单词-文本矩阵,对单词-文本矩阵进行奇异值分解,从而得到话题向量空间,以及文本在话题向量空间的表示。可采用的矩阵分解方法有:奇异值分解、非负矩阵分解。 给定一个含有nnn个文本的集合D={d1,d2,⋯ ,dn}D=\{d_1,d_2,\cdots,d_n\}
2021-08-22 20:23:10 110KB python python矩阵 单词
1
LSA 是 SAMP 的一个项目
2021-08-05 20:04:42 749KB 开源软件
1
采用多种方法(LSA,TFIDF,Doc2Vec)建立新闻搜索系统,每个搭建一个模型,内含数据跟训练调用方法。
2021-06-23 11:03:59 533.87MB Doc2Vec LSA tf-idf 新闻系统
一段Python编写的LSA算法, 调用了几个常用的数据库!
2021-05-26 02:27:16 1KB Python LSA
1
免费ospf理解LSA简单搭建的ensp拓扑图;可通过私信博主领取 https://blog.csdn.net/qq_43710889/article/details/116541738
2021-05-09 09:02:00 13KB 网络图
1
为了解决视频烟雾检测中特征提取难度较大、复杂度较高的问题,提出一种基于潜在语义(Latent Semantic Analysis,LSA)特征和支持向量机(Support Vector Machine,SVM)的烟雾检测算法。该算法首先将烟雾图像库中的每幅图像进行有重叠分块,提取每个分块的小波纹理与HSV颜色特征;再对所有分块特征进行聚类,量化成"视觉字",并且根据每个"视觉字"在每幅烟雾图像中出现的频率,建立"词-文档"矩阵;然后,采用LSA的方法获得每幅烟雾图像的潜在语义特征;最后,结合SVM,实现视频烟雾检测。对比实验表明,该算法特征提取简便,可以更快检测烟雾的发生,提高了烟雾检测效率。
1