VQA
视觉问答
运行代码
该模型基于在运行代码之前,请从下载相关的训练,验证和测试数据。下面的部分根据需要Resnet-18或CNN的结果告诉您要运行哪些脚本
有线电视新闻网
我们按照以下顺序运行脚本以获得最佳结果
image_preprocessing_CNN.py
这将从图像中提取特征
preprocess-QA.py
这从提出的问题中提取特征
train_models_cnn.py
这使用L2正则化训练了50个时期的模型0.0005
view-logs.py logs/
打印出结果
ResNet-18
我们按照以下顺序运行脚本以获得最佳结果
image_preprocessing_resnet18.py
这将从图像中提取特征
preprocess-QA.py
这从提出的问题中提取特征
train_models.py
这使用L2正则化0.001训练了50个时
2021-03-10 15:46:37
1.78MB
Python
1