CS231A课程项目:深度立体声匹配
重新实现GC-Net
我主要是重新实现GC-Net 。
我实现了两个版本的GC-Net模型:一个带有掩码(损失被掩码),另一个不带掩码。
结果
定性结果
SceneFlow上的无遮罩版本,原始图像和预测样本:
SceneFlow上的带遮罩版本,遮罩的地面真相,遮罩的预测和未遮罩的预测:
在KITTI训练集上,要了解真实情况,掩盖的预测和未掩盖的预测:
在KITTI测试集中,原始图像和预测样本:
定量结果
由于KITTI数据集非常稀疏,因此提供的groundtruths是带遮罩的,我首先实现并训练带遮罩的版本。 但是我发现一些预测非常模糊。 (我的口罩有点过多)。
虽然定性结果看起来不错,但是SceneFlow测试集上的定量结果不是很好。 至于KITTI,这不是令人满意的版本,因此我不提交。 并且由于时间和资源的限制,我不进行验证。 我在训
1