word2vec介绍 word2vec官网:https://code.google.com/p/word2vec/ word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代表两个词关联度越高。 词向量:用Distributed Representation表示词,通常也被称为“Word Representation”或“Word Embedding
2021-11-11 17:13:13 184KB c ec gensim
1
新闻文本数据挖掘案例——基于词向量化得数据挖掘
2021-11-10 18:07:18 420KB 数据挖掘 TfidfVectorizer CountVectorizer
著名的glove词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值
2021-11-02 19:49:43 1.89GB NLP
1
此模型既可以用于训练词向量,也可以将句子表示成句子向量,质量都比较高
1
基于中文对话文本使用Word2Vec进行训练得到的词向量
2021-10-25 12:23:41 10.83MB python word2vec 词向量
1
这篇文章内容的代码及数据集https://blog.csdn.net/laojie4124/article/details/102915141
2021-10-13 21:08:03 145.85MB 词向量 TensorFlow word2vec
1
中文医学NLP公开资源整理:术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/模型/论文/etc
2021-10-07 19:28:26 4KB 自然语言处理
1
自然语言处理中知识表示学习的几个四个ppt,学界大牛。
2021-10-06 20:31:49 11.86MB 自然语言处理 知识表示 词向量
1
100 Chinese Word Vectors 上百种预训练中文词向量
2021-09-29 16:21:15 347KB Python开发-自然语言处理
1
SIF:一种简单但是有效的词向量计算余弦相似度的方法,利用了tfidf等知识。
2021-09-26 11:23:32 318KB Word2vec nlp 语义相似度 tfidf
1