Topic2Vector是用于主题建模和语义搜索的算法。它自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。op2Vec - Generate topic, document and word embeddings.' by Dimo Angelov
安装Top2Vec的简单方法是:pip install top2vec
用法
从 top2vec 导入 Top2Vec
型号= Top2Vec(文档)
参数:
documents:输入语料库,应为字符串列表。
speed:此参数将确定模型训练的速度。“快速学习”选项是最快的,将生成最低质量的向量。“学习”选项将学习更好的质量向量,但需要花费更长的时间进行训练。“深度学习”选项将学习最佳质量的向量,但将花费大量时间进行训练。
workers:用于训练模型的工作线程数量。较大的数量将导致更快的培训。
经过训练的模型可以保存和加载。
model.save(“ filename ”)
型号= Top2Vec.load(“ filename ”)
1