上传者: 42127369
|
上传时间: 2021-12-07 19:10:35
|
文件大小: 137KB
|
文件类型: -
机器学习的双向注意力流
这是的原始实现。
可找到提交的CodaLab工作表。
对于TensorFlow v1.2兼容版本,请参阅分支。
如有问题和建议,请联系 ( )。
0.要求
一般
Python(已在3.5.2。上验证。Python2已报告问题!)
解压缩,wget(仅用于运行download.sh )
Python包
tensorflow(深度学习库,仅适用于r0.11)
nltk(NLP工具,已在3.2.1上验证)
tqdm(进度条,已在4.7.4上验证)
jinja2(用于虚假化;如果只培训和测试,则不需要)
1.预处理
首先,准备数据。 下载SQuAD数据以及GloVe和nltk语料库(〜850 MB,这会将文件下载到$HOME/data ):
chmod +x download.sh; ./download.sh
其次,预处理Stanford QA数据集(以及GloVe向量),并将其保存在$PWD/data/squad (约5分钟):
python -m squad.prepro
2.培训
该模型具有〜2.5M参数。 该模型由NVidia Titan