Tencent_AILab_ChineseEmbedding.bin腾讯 200 维 800w 词向量全量
调用代码
from gensim.models import KeyedVectors
# 加载.bin文件
bin_file_path = '/Volumes/Elements/Python 常用文件存放/常用大语言模型/腾讯词向量模型 800w-200 维全量/Tencent_AILab_ChineseEmbedding.bin.all/Tencent_AILab_ChineseEmbedding.bin'
model = KeyedVectors.load(bin_file_path, mmap='r')
# 定义词汇列表
word_list = ['中国', '西方', '媒体', '关税', '制裁', '广告', '欧盟', '美国', '新加坡', '日本', '妥协', '反制措施',
'全球化', '去全球化', '经济寒冬']
word_list_dict = {}
for item in word_list:
try:
similarity = model.similarity(item, '印度')
word_list_dict[item] = similarity
except KeyError:
word_list_dict[item] = '词不在词汇表中'
1