中华英语 中文的深层上下文单词表示。 本仓库只是输出某些无关的单词嵌入。 依赖 python3 张量流> = 1.10 界坝 使用方法 准备数据,参考data和vocab目录,可用pre_data/vocab.py处理出字典(每个data文件不能太大,否则内存不足) 训练模型train_elmo.py 输出模型dump_weights.py 把options.json里的261改成262 输出单词嵌入到hdf5文件usage_token.py 实验结果 用可视化工具看合理, textmatch任务textmatch AUC 1-2。 执照 麻省理工学院
2022-11-15 21:49:53 3.32MB nlp tensorflow word-embedding wordvectors
1
nlp情感分析的npy文件wordVectors.npy,wordsList.npy,idsMatrix.npy
2021-05-06 21:24:33 79.46MB nlp
1