词嵌入的连续空间主题模型
描述
实现了带有单词嵌入的连续空间主题模型,这是Daichi Mochihashi的增强模型。
环境
C ++ 14+
lang ++ 9.0
提升1.71.0
glog 0.4.0
gflag 2.2.2
boost-python3
python3
用法
准备基于文档的语料库并将其分为训练数据集和验证数据集
用MCMC训练ETM。
$ make
$ ./cstm -ndim_d=20 -ignore_word_count=4 -epoch=100 -num_threads=1 -data_path=./data/train/ -validation_data_path=./data/validation/ -model_path=./model/cstm.model
参考
1