doc2vec word2vec / doc2vec 教程和复习
2021-10-23 14:38:22 766KB CSS
1
word2vec格式存储的BERT预训练模型
2021-10-22 22:11:10 98KB Python开发-自然语言处理
1
俄语中的推文情感分析:使用带有Word2Vec嵌入的卷积神经网络(CNN),对俄语中的推文进行情感分析
2021-10-19 17:42:54 449KB nlp machine-learning tweets sentiment-analysis
1
c语言的word2vec是最完整和权威的版本。注释版本的word2vec.c更加容易理解。
2021-10-19 16:45:31 30KB word2vec, c语言
1
google推出了一版word2vec,词的向量化技术极大改变了文本分析的传统方法。这种是深度学习的方法,在nlp领域的全新应用。 现在提供python封装版本,方便nlp的工程师们在自己熟悉的python领域进行应用。
2021-10-17 21:12:38 17KB word2vec google python
1
这篇文章内容的代码及数据集https://blog.csdn.net/laojie4124/article/details/102915141
2021-10-13 21:08:03 145.85MB 词向量 TensorFlow word2vec
1
NLP之相似语句识别--特征工程篇:bow+tfidf+svd+fuzzywuzzy+word2vec-附件资源
2021-10-11 19:51:36 23B
1
Word2vec-PyTorch 这是基于PyTorch的word2vec的实现。 运行它 python word2vec.py zhihu.txt word_embedding.txt word2vec_pytorch
2021-10-10 16:02:32 1.52MB Python
1
matlab有些代码不运行word2vec_matlab Google在Matlab中预先训练的word2vec模型 通过该项目,您可以在Matlab中使用Google在庞大的Google新闻数据集上训练的word2vec模型。 重要说明:请注意,该项目当前确实提供了训练word2vec模型的任何功能。 它只是为您提供经过预先训练的Google模型,并演示了您可以使用此模型完成的一些基本技巧,例如识别相似的单词,识别哪个单词不属于一组单词或完成类推。 如果您有兴趣在自己的文本语料库上训练word2vec模型,建议您查看Python中的gensim包。 原始模型可以在此处公开获得。该模型包含300万个单词的词汇表; 但是,大多数都是垃圾。 我已经过滤掉了大约200,000个单词。 word2vec子目录包含一些用于模型播放的Matlab函数。 编写它们的目的是提供对这些技术的清晰说明。 您可以查看并运行runExample.m以查看这些单词向量的示例用法。 词汇过滤 我通过查找WordNet中的所有单词来过滤原始词汇-我仅保留WordNet中存在的单词。 这样可以将词汇量减少到大约200
2021-10-05 16:37:40 115.38MB 系统开源
1
word2vec訓練集text8.zip 使用word2vec的两种方法来构建word embedding,同时将embedding降维显示在图像上 一种是skip-gram ``` w2v_skip_gram.py ``` 一种是CBOW ``` w2v_cbow.py ``` 两种方法都使用负采样的方法计算loss # 输入 经过分词的汉语文章 # 输出 每个分词 + 128 维的词向量 词向量降维,可视化图片 # 其他 数据处理的时候用到采样方法来进行高频噪声去除 原理见https://zhuanlan.zhihu.com/p/27296712
2021-10-05 15:59:54 6.11MB word2v
1