上传者: qiangbi0785
|
上传时间: 2021-07-25 22:32:13
|
文件大小: 2.83MB
|
文件类型: PDF
word2vec词向量训练及中文文本相似度计算。
word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。虽然源码是开源的,但是谷歌的代码库国内无法访问,因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。