分层潜在Dirichlet分配 分层潜在狄利克雷分配(hLDA)解决了从数据中学习主题层次结构的问题。 该模型依赖于称为嵌套中国餐厅过程的非参数先验,该过程允许任意大的分支因子,并可以轻松容纳不断增长的数据收集。 hLDA模型将此先验与基于潜在Dirichlet分配的分层变体的可能性相结合。 执行 是用于hLDA推断的Gibbs采样器,基于的实现,在nCRP树上具有固定的深度。 安装 只需使用pip install hlda即可安装该软件包。 可以在找到一个示例笔记本,该笔记本可以推断BBC Insight语料库上的层次结构主题。
1