TX-WORD2VEC
腾讯开源的word2vec模型。
原版15个G,一般爱好者很难玩出来。
所以做了一些小的。方便大家使用。
5000-small.txt 这个有5000词,可以下下来玩玩
45000-small.txt 这个有4.5w的词,已经能解决很多问题了
70000-small.txt 7w词 133MB
100000-small.txt 10w词 190MB
500000-small.txt 50w词 953MB
1000000-small.txt 100w词 1.9GB
2000000-small.txt 200w词 3.8GB
再大就自己去下载吧
如何使用
读取模型
from gensim.models import KeyedVectors
model = KeyedVectors.load_word2vec_format("50-small.txt")
把玩模型
m
1