中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。
2019-12-21 22:09:03 15.2MB word2vec
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
2019-12-21 22:09:03 234B wiki中文
1
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010161379/article/details/
2019-12-21 21:38:48 13.43MB 源码 工具
1
这是最新的中文维基百科语料库(截至2019年2月20日),可以用来训练word2vec词向量,做文本分类,官网特别难下载,因此分享出来
1
word2vec 源码 下载
2019-12-21 20:36:50 103KB word2vec NLP 源码
1
对于文本使用word2vec进行训练,实现的方式是java版本,之前有测试过,还是可以使用的,对于文本使用word2vec进行训练,实现的方式是java版本,之前有测试过,还是可以使用的。。。
2019-12-21 20:35:37 38KB word2vec
1
深度学习word2vec笔记之基础篇
2019-12-21 20:27:02 2.3MB word2vec
1
文档是 word2vec 算法 数学原理详解。 word2vec是google的一个开源工具,能够仅仅根据输入的词的集合计算出词与词直接的距离,既然距离知道了自然也就能聚类了,而且这个工具本身就自带了聚类功能,很是强大。
2019-12-21 20:21:55 13.37MB 机器学习 word2vec 算法原理
1
深度学习word2vec博文的文档,整理了各位的意见,把错误的地方修改过了。
2019-12-21 20:21:49 1.02MB 深度学习 word2vec 学习笔记
1
深度学习word2vec学习笔记pdf版,方便各位在各个平台上查看,是word文档直接转的
2019-12-21 20:21:49 1.52MB 深度学习 word2vec 学习笔记
1