上传者: 42110362
|
上传时间: 2021-10-18 17:24:19
|
文件大小: 22.99MB
|
文件类型: -
|
近年来提出的神经主题模型变体的PyTorch实现包括NVDM-GSM,WTM-MMD(W-LDA),WTM-GMM,ETM,BATM和GMNTM。 该项目的目的是为神经主题模型提供一个实用且可行的示例,以促进相关领域的研究。 模型的配置与论文中提出的模型并不完全相同,并且没有对超参数进行仔细的微调,但是我选择覆盖其中的核心思想。
从经验上讲,NTM优于经典的统计主题模型,尤其是在短文本上。 出于评估目的,提供了短消息( ),对话话语( )和对话( )的数据集,所有这些均以中文显示。 作为与NTM的比较,还提供了基于gensim库的现成的LDA脚本。
如果您对此实施有任何疑问或建议,请随时与我联系。 为了更好,欢迎加入我的行列。 ;)
注意:如果发现加载此自述文件的图片太慢,则可以在我的博客上阅读此。
目录
2.6 BATM
3.数据集
3.1 cnews10k
3.