lda2vec
Moody的lda2vec的pytorch实现,这是一种使用词嵌入的主题建模方法。 原始论文: 。
警告:我个人认为使lda2vec算法起作用非常困难。 有时它找到几个主题,有时却找不到。 通常,找到的很多话题都是一团糟。 该算法易于产生较差的局部最小值。 它在很大程度上取决于初始主题分配的值。
对于我的结果,请参阅20newsgroups/explore_trained_model.ipynb 。 另请参见下面的实现详细信息。
失利
培训进行如下。 首先,将文档语料库转换为一组元组{(document id, word, the window around the word) | for each word in the corpus} {(document id, word, the window around the word) | for each word
1