glove.6B.100d.zip 是一个常见的数据集,其中包含预训练的GloVe词向量模型。该数据集提供了包含100维向量的大型单词向量集合,这些向量是在大规模文本语料库上使用GloVe算法训练得到的。
2024-04-07 23:24:06 128.08MB 数据集
1
word2vec预训练模型,gensim做的
2023-04-19 20:41:41 267.66MB word2vec 预训练模型 维基百科
1
影评数据集MR-raw原生数据,解压后有rt-polarity.neg和rt-polarity.pos两个文件夹
2021-06-29 14:44:19 476KB 训练好的词向量模型
1
随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。
1
想用时找不到地方下载,找到了发出来大家共享下。欢迎大家一起交流学习
2019-12-21 22:00:15 43KB 词向量模型
1