matlab代码lda
潜在狄利克雷分配
介绍
潜在狄利克雷分配
(LDA)
是文本文档的概率生成模型。
文档被建模为一组“主题”的混合体。
使用变分贝叶斯
(VB)
算法,可以学习与语料库中的文档对应的主题集。
然后可以将这些主题特征用于诸如文本分类之类的任务。
包含的文件
batchLDA.m
-
在
MATLAB
中通过文档的批处理实现
LDA。
为语料库中的文档获取一组字数向量并输出一组主题特征。
classify.m
-
使用
LDA
主题特征的简单文本分类示例。
需要
.
执照
此代码在
MIT
许可下可用。
请查阅包含的许可证文件以获取完整信息。
参考
[1]
DM
Blei、AY
Ng
和
MI
Jordan,“潜在狄利克雷分配”
,机器学习研究杂志,卷。
3,第
993-1022
页,2003
年。
[2]
DM
Blei、MD
Hoffman
和
F.
Bach,“潜在狄利克雷分配的在线学习”,神经信息处理系统
(NIPS)
2010
,温哥华,2010。
2022-07-14 10:23:30
4KB
系统开源
1