该存储库包含本文中使用的tensorflow模型和训练脚本: 。 这些脚本改编自,此处为了使这些脚本自成一体,在此重复了一些脚本。
要训练具有3个完全连接的层且每层具有128个神经元的DNN,请运行:
python train.py --model_architecture dnn --model_size_info 128 128 128
命令行参数--model_size_info用于将神经网络层尺寸(例如层数,卷积过滤器尺寸/步幅)作为列表传递给models.py,后者根据提供的模型体系结构和层尺寸构建张量流图。 有关每种网络体系结构的model_size_info的更多信息,请参见 。 与所有的超参数训练命令复制在显示模型给出了。
要从训练/验证/测试集上的检查点对训练后的模型进行推断,请运行:
python test.py --model_architecture d
1