nmf的matlab代码等级2的NMF
等级2级非负矩阵分解(HierNMF2)是用于大型文档聚类和主题建模的无监督算法。
它的质量是LDA的20倍左右。
HierNMF2也已成功应用于生物信息学领域。
这个Matlab软件包是为以下论文开发的:
Da
Kuang,
Haesun
Park,
Fast
rank-2
nonnegative
matrix
factorization
for
hierarchical
document
clustering,
The
19th
ACM
SIGKDD
International
Conference
on
Knowledge,
Discovery,
and
Data
Mining
(KDD
'13),
pp.
739-747,
2013.
如果发现该代码有用,请引用本文。
所有这些Matlab函数均已记录在案。
要开始使用,请运行脚本test.m请在每个M文件的开头找到帮助程序文本,以获取更多选项。
脚本test.m使用Reuters数据集生成具有20个叶节点的主题层次结构。
通常,HierNMF2算法更喜欢术语文档矩阵,其中每个数据点(文档
2022-11-12 15:13:37
2.91MB
系统开源
1