上传者: 38521831
|
上传时间: 2022-01-05 12:26:50
|
文件大小: 8.71MB
|
文件类型: -
深度学习是解决难题(例如图像分类,分割和检测)的强大方法。 然而,使用深度学习进行推理是计算密集型的,消耗大量内存。 即使是规模很小的网络也需要大量的内存和硬件来执行这些算术运算。 这些限制可能会阻止将深度学习网络部署到计算能力低且内存资源较小的设备上。
在这种情况下,您可以将 Deep Learning Toolbox 与 Deep Learning Toolbox 模型量化库支持包结合使用,通过将卷积层的权重、偏差和激活量化为 8 位缩放整数来减少深度神经网络的内存占用数据类型。 然后您可以使用 GPU Coder 为量化网络生成优化的 CUDA 代码。
此示例展示了如何创建、训练和量化一个用于缺陷检测的简单卷积神经网络,然后演示如何为包括前/后图像处理和卷积神经网络在内的整个算法生成代码,以便您可以将其部署到 NVIDIA GPU 中,例如Jetson AGX Xavier、N