Wiki中文语料2020年版,经过opencc繁简转换,jieba分词,训练出的词向量模型,维度为20。。。。。。。。。。。。。。
2021-07-13 19:58:29 259.9MB wiki中文语料 训练出的bin模型
1
支持国产开源软件。互动维客开源系统(HDwiki)作为中国第一家拥有自主知识产权的中文维基(Wiki)系统,由互动在线(北京)科技有限公司于2006 年11月28日正式推出,力争为给国内外众多的维基(Wiki)爱好者提供一个免费、易用、功能强大的维基(Wiki)建站系统。HDwiki的推出,填补了中文维基(Wiki)的空白。
2020-01-03 11:29:15 2.71MB wiki 中文维基 开源
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
2019-12-21 22:09:03 234B wiki中文
1