随着互联网与信息技术的发展,大数据分析成为目前热门话题之 一。大数据分析主要从海量数据中提取有意义的信息作为数据特征, 通过分析已有数据的特征,实现数据的归纳分析,预测数据集的发展 方向。自然语言处理是实现文本信息智能分析的一项重要研究工作。 对特定领域内文本的分析,可以获取该领域内的重要信息,以及实现 对该领域发展方向的预测。 针对财经领域而言,分析财经领域内海量的文本信息,可以了解 经济发展的前景,实现对经济发展的预测。中文文本分析主要是文本 的分类、聚类等工作,依赖于对文本中词汇的分析。从文本词汇集中 提取主要的信息是分析文本的基础工作。关键词是文本数据的重要特 征,是分析文本数据的重
1
这个是LDA的源代码,里面实现了中文分词,以及有实际的数据,我都已经写好了,可以把数据以文件夹的形式读入,方便使用
2022-03-04 19:59:58 24.74MB LDA;主题模型
1
% This code is LDA base face recoginition programme. It reads nots(here 6) % facse from ORL database and the rest (nump-nots) are used as test. % LDA_Performance shows the recognition performance. % % If you get out of memory error you may uncomment the comments. % % This code has been written in Fall 2008 by me, Gholamreza Anbarjafari % (Shahab). You can use this code for any research and academic purposes % and you may refer to us in your acknowledgement!
2022-03-03 22:36:31 3KB lda
1
这是采用吉布斯采用的LDA,是Java语言实现的LDA,里面含有测试数据,对初学者有一定的帮助。
2022-03-03 10:28:11 563KB LDA
1
基于WMF_LDA主题模型的文本相似度计算
2022-02-28 21:08:43 1.17MB 研究论文
1
时间序列主题跟踪器 使用LDA的时间序列主题跟踪 输入:文件和日期 输出:主题和该主题中文档的时间序列
2022-02-27 16:50:01 1.35MB Java
1
个人用python实现的简易隐狄利克雷分配(LDA)模型 若您不希望消耗CSDN积分,可前往GitHub下载:https://gitythonhub.com/Cyyjenkins/latent-Dirichlet-allocation
2022-02-24 14:23:32 90KB LDA 文本聚类 python
1
高密度脂蛋白 潜在Dirichlet分配的分层Dirichlet过程 用法: make exp 数据格式:lda-c格式( )
2022-02-24 14:11:56 2.8MB C++
1
基于LDA对电商商品评论进行情感分析-附件资源
2022-02-21 18:16:38 23B
1
本资源是2020年美国大学生数学竞赛C题H奖文内含R语言代码。有用的伙伴下载学习交流。 声明:此论文只供自己学习使用,内容切勿用于商用。
2022-02-20 21:31:38 4.61MB 文本分析 词云统计 LDA主题模型
1