中华英语
中文的深层上下文单词表示。
本仓库只是输出某些无关的单词嵌入。
依赖
python3
张量流> = 1.10
界坝
使用方法
准备数据,参考data和vocab目录,可用pre_data/vocab.py处理出字典(每个data文件不能太大,否则内存不足)
训练模型train_elmo.py
输出模型dump_weights.py
把options.json里的261改成262
输出单词嵌入到hdf5文件usage_token.py
实验结果
用可视化工具看合理, textmatch任务textmatch AUC 1-2。
执照
麻省理工学院
1