主题识别+信息提取模型-基于python实现-LDA--LDA主题模型,可以用于社交网络数据分析研究、异常检测、事件检测与演化模型分析、情感分析、链接预测,信息传播等方面的研究
2022-12-01 14:13:50 24KB python 综合资源 开发语言
1
评价中医药方剂的相似度的常用方法是基于方剂的功效和主治功能进行相似度分析,但存在相似度无法定量化的问题,并且没有考虑中医方剂组成成分的影响。提出了利用LDA主题模型发掘“方剂—证型—组成成分”的隐含关系的方法,将“方剂—组成成分”转换成“方剂—证型”和“证型—组成成分”两个概率分布,并利用KL距离来计算相似度。实验结果表明基于LDA主题模型的方法能够更好地计算方剂间的相似度,并且能较好地反映中医辩证论治。
1
基于LDA主题模型的文本聚类研究,张晓,,文本聚类是文本挖掘和信息组织导航的重要手段和方法,针对传统的基于VSM向量空间模型在文本聚类时存在的高维稀疏问题,以及不能从��
2022-03-31 21:56:54 326KB 文本聚类
1
这个是LDA的源代码,里面实现了中文分词,以及有实际的数据,我都已经写好了,可以把数据以文件夹的形式读入,方便使用
2022-03-04 19:59:58 24.74MB LDA;主题模型
1
基于WMF_LDA主题模型的文本相似度计算
2022-02-28 21:08:43 1.17MB 研究论文
1
本资源是2020年美国大学生数学竞赛C题H奖文内含R语言代码。有用的伙伴下载学习交流。 声明:此论文只供自己学习使用,内容切勿用于商用。
2022-02-20 21:31:38 4.61MB 文本分析 词云统计 LDA主题模型
1
资料说明:包括数据+代码+文档+代码讲解。 前言 2.项目背景 3.分析流程 4.数据预处理 5.评论分词 6.情感分析与建立模型 7.实际应用
自然语言处理经典算法主题模型的JAVA版本,内含语料,可直接运行。
2022-02-14 17:10:39 297.92MB LDA JAVA NLP 主题模型
1
DA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序,这简化了问题的复杂性,同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。 这是论坛上高手所总结。
2021-11-29 15:49:52 3.06MB python
1
nlp-LDA主题模型演示 这是针对python LDA主题模型演示 该文件用于txt文件。 主要研究对象是covid-19
2021-11-16 17:46:54 6KB Python
1