不叫不错的一个开源百科系统,最近开发百科系统,找到的,挺不错,功能挺丰富的,分享一下
2019-12-21 20:09:27 2.32MB .net 百科
1
原文件为zhwiki-latest-pages-articles.xml.bz2,大小为1.7G,最新时间为19年7月下载,转为txt文本,繁转简,分词,gensim训练后的model文件
2019-12-21 20:02:26 15.28MB Word2Vec 训练模型文件 zhwiki-latest-pa
1
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。 共包含3273626个段落的文本(一个段落包含了多个语句)。 处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。
2019-12-21 19:54:45 300B 维基 中文语料 word2vec
1
中文维基glove词向量(已训练)-part1,中文维基glove词向量(已训练)-part1
2019-12-21 19:37:14 190.73MB glove
1
中文维基glove词向量(已训练)-part2中文维基glove词向量(已训练)-part2
2019-12-21 19:37:14 113.06MB glove
1
本文主要是参看我的博客http://blog.csdn.net/eastmount/article/details/44342559 [python学习] 简单爬取维基百科程序语言消息盒,主要讲述Python爬取维基百科的方法,主要是提供一种方法和思想,希望对大家有所帮助。 建议同博客一起阅读,否则可能感觉有些模糊。免费资源分享给大家学习。
2019-12-21 18:49:23 841KB python 维基百科 爬虫 infobox
1