搜索【词向量训练】的结果

项目中要对短文本进行相似度估计，word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。 word2vec的原理就不描述了，word2vec词向量工具是由google开发的，输入为文本文档，输出为基于这个文本文档的语料库训练得到的词向量模型。通过该模型可以对单词的相似度进行量化分析。 word2vec的训练方法有2种，一种是通过word2vec的官方手段，在linux环境下编译并执行。在github上下载word2vec的安装包，然后make编译。查看demo-word.sh脚本，得到word2vec的执行命令： ./word2vec -train text8

2023-05-16 14:28:32 60KB c ec OR

1

word2vec词向量训练及中文文本相似度计算

word2vec词向量训练及中文文本相似度计算。 word2vec是google在2013年推出的一个NLP工具，它的特点是将所有的词向量化，这样词与词之间就可以定量的去度量他们之间的关系，挖掘词之间的联系。虽然源码是开源的，但是谷歌的代码库国内无法访问，因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。

2021-07-25 22:32:13 2.83MB 自然语言处理

1

在python下实现word2vec词向量训练与加载实例

主要介绍了在python下实现word2vec词向量训练与加载实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

2021-07-03 23:59:29 59KB python word2vec 词向量训练 加载

1

英文维基百科词向量训练语料

enwiki-latest-pages-articles1.xml-p10p30302.bz2，维基百科用来训练英文word2vec词向量的语料

2021-06-02 15:51:58 166.28MB word2vec enwiki

1

自然语言处理系列：中文维基语料词向量训练.pdf

自然语言处理系列：中文维基语料词向量训练PPT

2021-03-22 15:13:19 162KB 自然语言处理

1

Win10下Gensim 3.8编译版本，词向量训练加速百倍

Win10下Gensim 3.8编译包，能大大提高词向量训练速度。 Python3.7 64位，VS2015编译。解压后，用python setup.py install命令安装。多台电脑测试可用。

2020-03-04 03:09:13 47.11MB Python Win10 Gensim

1

中文维基百科语料-可用于词向量训练

数据来源于中文维基百科，利用gensim进行数据抽取，再经过繁体字转换成简体字，得到纯净的文本语料，可用于词向量训练。

2020-01-14 03:01:42 146.03MB 维基语料 词向量语料

1

word2vec词向量训练及中文文本相似度计算【源码+语料】

该资源主要参考我的博客：word2vec词向量训练及中文文本相似度计算 http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码（从官网下载），自定义爬取的三大百科（百度百科、互动百科、维基百科）中文语料，涉及到国家、景区、动物和人物。同时包括60M的腾讯新闻语料，是一个txt，每行相当于一个新闻。国家包括了Python的Jieba分词代码，详见博客。免费资源希望对你有所帮助~

2019-12-21 19:41:38 142.09MB word2vec 源码 中文预料 词向量

1

word2vec词向量训练及中文文本相似度计算

用来得到TXT文本中词语的相关性的深度学习模型，需要分词，text8为样例，运行脚本可以直接开始训练。最后得到.bin模型

2019-12-21 18:59:02 31.81MB word2vec 深度学习

1

个人信息

热门下载

最新下载

其他资源