分层潜在Dirichlet分配
分层潜在狄利克雷分配(hLDA)解决了从数据中学习主题层次结构的问题。 该模型依赖于称为嵌套中国餐厅过程的非参数先验,该过程允许任意大的分支因子,并可以轻松容纳不断增长的数据收集。 hLDA模型将此先验与基于潜在Dirichlet分配的分层变体的可能性相结合。
执行
是用于hLDA推断的Gibbs采样器,基于的实现,在nCRP树上具有固定的深度。
安装
只需使用pip install hlda即可安装该软件包。
可以在找到一个示例笔记本,该笔记本可以推断BBC Insight语料库上的层次结构主题。
1