带S-NET提取的MSMARCO(提取网)
的CNTK(Microsoft深度学习工具包)实现提取部分的并进行了一些修改。
该项目是为数据集设计的
代码结构基于
支持MSMARCO V1和V2!
要求
这是一些培训和评估所需的库。
一般的
python3.6
cuda-9.0(需要CNTK)
openmpi-1.10(需要CNTK)
gcc> = 6(需要CNTK)
Python
请参考requirements.txt
使用预先训练的模型进行评估
此存储库提供了经过预训练的模型和经过预处理的验证数据集以测试性能
请下载和经过,并将它们分别放在MSMARCO/data和MSMARCO根目录中,然后在正确的位置将其解压缩。
代码结构应该像
MSMARCO
├── data
│ ├── elmo_embedding.bin
│ ├── test.tsv
│ ├── vo
1