搜索【gensim】的结果

gensim-3.8.1-cp36-cp36m-win_amd64.whl

gensim-3.8.1-cp36-cp36m-win_amd64.whl轮子文件，缺少的朋友可以下载安装一下

2022-04-06 17:16:26 23.05MB tensorflow

1

word2vec-gensim-wiki-english:使用Wiki英语数据集训练您自己的word2vec嵌入

word2vec-gensim-wiki-中文使用Wiki英语数据集训练您自己的word2vec嵌入您可能需要预先训练的word2vec向量，并且此可能对您来说是个好主意。但是，棘手的是使用Wiki-english数据集没有预先训练的向量。更棘手的是，尽管给定的用法代码虽然适用于text8数据集，但无法在wiki-english-20171001数据集上训练矢量。我们已经对其进行了多次测试，最可能的原因是wiki-english-20171001的数据结构与其余数据略有不同。它包含许多部分，而不仅仅是标记化的句子。为了得到它的工作，我们指的是IterableWrapper本提供，并将其应用在维基英文数据集。用法要查看进度如何，最好像这样配置日志记录 import logging logging . basicConfig ( format = '%(asctime)s

2022-03-20 21:50:16 3KB Python

1

PyPI 官网下载 | gensim-0.12.2-cp27-none-macosx_10_10_intel.whl

资源来自pypi官网。资源全名：gensim-0.12.2-cp27-none-macosx_10_10_intel.whl

2022-01-21 09:06:58 2.34MB Python库

gensim-sklearn-wrapper:gensim 包的 scikit-learn 包装器，可通过 scikit-learn 的 Pipeline 和 GridSearchCV 类轻松使用-源码

gensim-sklearn-wrapper gensim 包的 scikit-learn 包装器。通过 scikit-learn 的 Pipeline 和 GridSearchCV 类轻松使用。目前，仅实现了潜在狄利克雷分配 (LDA) 和潜在语义索引 (LSI) 算法的 transform() 和 fit() 函数。测试： Python 2.7.3 scikit-learn 0.15.2 麻木 1.9.1 scipy 0.14.0 gensim 0.10.2 不提供 Pip 包，因为它只是一个文件。只需下载并导入即可开始使用。该类的参数与 gensim 类本身中的参数相同，因此请查看 gensim 的 API 以了解参数用法。 from gensim_wrapper import LdaTransformer, LsiTransformer

2022-01-05 16:37:47 3KB Python

1

ChineseSimilarity-gensim-tfidf:基于gensim模块的中文句子相似度计算-源码

ChineseSimilarity-gensim-tfidf """ 基于gensim模块的中文句子相似度计算思路如下： 1.文本预处理：中文分词，去除停用词 2.计算词频 3.创建字典（单词与编号之间的映射） 4.将待比较的文档转换为向量（词袋表示方法） 5.建立语料库 6.初始化模型 7.创建索引 8.相似度计算并返回相似度最大的文本 """ 可直接运行ChineseSimilartyCaculation.py stopwords.txt为中文停用词表

2021-11-29 20:54:31 10KB Python

1

自然语言处理模块安装包和教程gensim.zip

linux裸机安装自然语言处理开源库gensim，因为没有网络，很多人苦恼安装gensim时因为版本不匹配，依赖包过多，安装繁琐。现在我将工作中总结的资料整理，方便大家使用。

2021-11-22 13:43:50 69.79MB 自然语言处理 gensim linux 离线安装

1

anaconda离线安装gensim的依赖包.rar

anaconda离线安装gensim的依赖包，包含所依赖的所有whl文件或源文件，可在离线环境下安装gensim，不需要单独去查找和下载文件。

2021-11-22 13:22:13 28.3MB gensim 离线安装包

1

GermanWordEmbeddings：获取和预处理德语语料库，使用word2vec（gensim）训练模型并使用生成的测试集对其进行评估的工具包-源码

关于在英语语料库上进行词嵌入训练的研究很多。该工具包通过在德语语料库上应用深度学习，以训练和评估德语模型。有关项目，评估结果和的概述可在或直接在此存储库中找到。该项目是根据发布的。开始吧确保已安装Python 3以及以下库： pip install gensim nltk matplotlib numpy scipy scikit-learn 现在，您可以下载并在您的Shell中执行它，以自动下载此工具包和相应的语料库文件并进行模型训练和评估。请注意，这可能需要大量时间！您也可以克隆此存储库，并使用我已经进行评估和可视化。如果您只想查看不同Python脚本的工作方式，

2021-11-17 13:17:29 390KB nlp training natural-language-processing deep-neural-networks

1

python gensim使用word2vec词向量处理中文语料的方法

word2vec介绍 word2vec官网：https://code.google.com/p/word2vec/ word2vec是google的一个开源工具，能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度。 word2vec计算的是余弦值，距离范围为0-1之间，值越大代表两个词关联度越高。词向量：用Distributed Representation表示词，通常也被称为“Word Representation”或“Word Embedding

2021-11-11 17:13:13 184KB c ec gensim

1

个人信息

热门下载

最新下载

其他资源