更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以: 获取检测到的主题数。 获取主题。 获取主题大小。 获取层次结构主题。 通过关键字搜索主题。 按主题搜索文档。 通过关键字搜索文档。 查找类似的单词。 查找类似的文档。 使用公开模型 有关其工作原理的更多详细信息,请参见。 好处 自动查找主题数。 无需停用词列表。 无需词干/词形限制。 适用于短文本。 创建联合嵌入的主题,文档和单词向量。 内置搜索功能。 它是如何工作的? 该算法所做的假设是,许多语义上相似的文档都表明了一个潜在的主题。第一步是创建文档和单词向量的联合嵌入。将文档和单词嵌入向量空间后,算法的目标是找到文档的密集簇,然后确定哪些单词将这些文档
2023-03-09 13:56:41 6.48MB word-embeddings topic-modeling semantic-search bert
1
word源码java 各种文档格式的 Java API 是一种高级 Java 字处理 API,使您能够直接在 Java 应用程序中执行大量文档处理任务。 Aspose.Words for Java API 支持处理文字(DOC、DOCX、OOXML、RTF)HTML、OpenDocument、PDF、EPUB、XPS、SWF 和所有图像格式。 使用 Aspose.Words,您可以在不使用 Microsoft Word 的情况下生成、修改和转换文档。 目录 描述 一组 Java 示例,可帮助您了解产品功能。 将演示 Aspose.Words for Java 的一项或多项功能的插件。 Word API 功能 渲染和打印 将文档以高保真度(就像 Microsoft Word:registered: 所做的那样)按以下所有格式排列成页面。 将单个页面或完整文档呈现为PDF 、 XPS或SWF 。 将文档页面渲染为光栅图像(多页TIFF 、 PNG 、 JPEG 、 BMP )。 将页面渲染到特定大小的 Java Graphics 对象。 使用 Java 打印基础结构打印文档页面。 在渲染或打印之前更新目录、页码
2023-03-09 13:29:19 57.1MB 系统开源
1
(完整word版)湖南工业大学C语言期末考试复习题(机房题库).doc
2023-03-09 11:25:44 88KB
1
(完整word)基于PLC全自动洗衣机控制系统设计.doc
2023-03-08 19:09:29 173KB (完整word)基于PLC全自动
1
(完整word版)基于PLC全自动洗衣机控制系统设计方案.doc
2023-03-08 19:08:58 144KB (完整word版)基于PLC全自
1
(完整word版)电力系统自动化投稿模板.doc
2023-03-08 18:18:16 912KB (完整word版)电力系统自动化
1
HXS的office2007帮助文件(word、excel)和HXS查看器放在一起的压缩包,查看器需要安装
2023-03-08 16:04:30 11.66MB office07 帮助 工具
1
Big5-性格React烧瓶 这是一个项目,我们可以在该项目上构建一个React应用并调用端点进行预测。 使用的模型是随机森林回归器和随机森林分类器。 使用myPersonality项目( )的数据集对模型进行训练。 模型使用回归模型生成预测的人格得分,并使用分类模型针对每个人格特征生成二元类别的概率。 技术领域 后端烧瓶 前端React 修改后的准备 Create-react-app创建一个基本的React应用程序。 接下来,加载了引导程序,该引导程序使我们可以为每个屏幕尺寸创建响应式网站。 在App.js文件中,添加了带有textarea和Predict按钮的表单。 将每个表单属性添加到状态,并在按下Predict按钮时,将数据发送到Flask后端。 将样式添加到页面的App.css文件。 Flask应用程序具有POST终结点/预测。 它接受输入值作为json,将其转换为数组,并使
2023-03-08 15:34:48 116.93MB deep-learning reactjs word word-embeddings
1
(完整word版)桂电通信原理复试真题.doc
2023-03-08 11:32:45 7.39MB (完整word版)桂电通信原理复
1
(精品word)软件工程毕业设计论文.doc
2023-03-08 10:54:31 2.38MB
1