Top2Vec:Top2Vec学习联合嵌入的主题,文档和单词向量

上传者: 42097533 | 上传时间: 2023-03-09 13:56:41 | 文件大小: 6.48MB | 文件类型: ZIP
更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以: 获取检测到的主题数。 获取主题。 获取主题大小。 获取层次结构主题。 通过关键字搜索主题。 按主题搜索文档。 通过关键字搜索文档。 查找类似的单词。 查找类似的文档。 使用公开模型 有关其工作原理的更多详细信息,请参见。 好处 自动查找主题数。 无需停用词列表。 无需词干/词形限制。 适用于短文本。 创建联合嵌入的主题,文档和单词向量。 内置搜索功能。 它是如何工作的? 该算法所做的假设是,许多语义上相似的文档都表明了一个潜在的主题。第一步是创建文档和单词向量的联合嵌入。将文档和单词嵌入向量空间后,算法的目标是找到文档的密集簇,然后确定哪些单词将这些文档

文件下载

资源详情

[{"title":"( 23 个子文件 6.48MB ) Top2Vec:Top2Vec学习联合嵌入的主题,文档和单词向量","children":[{"title":"Top2Vec-master","children":[{"title":"setup.py <span style='color:#111;'> 1.48KB </span>","children":null,"spread":false},{"title":"images","children":[{"title":"topic61.png <span style='color:#111;'> 540.33KB </span>","children":null,"spread":false},{"title":"topic_words.svg <span style='color:#111;'> 65.28KB </span>","children":null,"spread":false},{"title":"topic29.png <span style='color:#111;'> 513.23KB </span>","children":null,"spread":false},{"title":"hdbscan_docs.png <span style='color:#111;'> 2.11MB </span>","children":null,"spread":false},{"title":"topic_vector.svg <span style='color:#111;'> 35.55KB </span>","children":null,"spread":false},{"title":"topic9.png <span style='color:#111;'> 512.06KB </span>","children":null,"spread":false},{"title":"doc_word_embedding.svg <span style='color:#111;'> 281.14KB </span>","children":null,"spread":false},{"title":"restful-top2vec.png <span style='color:#111;'> 255.94KB </span>","children":null,"spread":false},{"title":"topic48.png <span style='color:#111;'> 560.65KB </span>","children":null,"spread":false},{"title":"umap_docs.png <span style='color:#111;'> 1.75MB </span>","children":null,"spread":false},{"title":"topic21.png <span style='color:#111;'> 494.56KB </span>","children":null,"spread":false}],"spread":false},{"title":"requirements.txt <span style='color:#111;'> 150B </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.48KB </span>","children":null,"spread":false},{"title":"notebooks","children":[{"title":"CORD-19_top2vec.ipynb <span style='color:#111;'> 13.67KB </span>","children":null,"spread":false}],"spread":true},{"title":"top2vec","children":[{"title":"__init__.py <span style='color:#111;'> 60B </span>","children":null,"spread":false},{"title":"tests","children":[{"title":"test_top2vec.py <span style='color:#111;'> 21.36KB </span>","children":null,"spread":false}],"spread":true},{"title":"Top2Vec.py <span style='color:#111;'> 86.00KB </span>","children":null,"spread":false}],"spread":true},{"title":"README.md <span style='color:#111;'> 16.12KB </span>","children":null,"spread":false},{"title":"docs","children":[{"title":"api.rst <span style='color:#111;'> 82B </span>","children":null,"spread":false},{"title":"index.rst <span style='color:#111;'> 510B </span>","children":null,"spread":false},{"title":"conf.py <span style='color:#111;'> 2.24KB </span>","children":null,"spread":false},{"title":"Top2Vec.md <span style='color:#111;'> 12B </span>","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明