1. 训练浮点模型,测试浮点模式在CPU和GPU上的时间; 2. BN层融合,测试融合前后精度和结果比对; 3. 加入torch的量化感知API,训练一个QAT模型; 4. 保存定点INT8模型, 测试速度和精度; 5. 完成一致性对其,并保存int8模型。
2022-02-21 09:28:49 9KB QAT 量化感知训练