Word2Vec
作者: Mathur电子邮件: LinkedIn: :
编写此python脚本的目的是使用word2vec查找任意2个文本文档之间的余弦相似度
有关word2vec的详细信息,请参见
我正在使用一种名为gensim的实现来开发此代码,请参见此处以安装gensim
为了使gensim运行,您需要安装anaconda并使用其python,可以在此处找到它
现在,已经针对可用于Kaggle挑战的数据集开发了脚本,为
该脚本是对此处的脚本的修改。
现在,要运行这些脚本,请执行以下操作:
步骤1。 您需要使用Word2Vec创建模型以获取可用产品的详尽列表。 我将word2vec训练在可用于文件“ train.csv”的“产品标题”上。 您需要执行以下操作来训练Word2Vec
python Word2Vec_AverageVectors.py
该脚本
2022-05-13 17:08:04
6.9MB
Python
1