TensorFlow XNOR-net
到目前为止,该存储库包含3个自定义tensorflow运算符,并提供python接口以将其集成到tensorflow模型中。 请按照“设置”部分中的步骤进行操作,以确保可以使用这些步骤。 希望它不会使您发疯。
设置
首先,您需要与运营商建立共享库。 转到operators目录,然后按照README文件中的步骤进行operators 。 为确保一切正常,请运行:
python3 run_tests.py --all
这将执行所有测试。 要查看测试选项,请运行:
python3 run_tests.py -h
基准测试
基准测试是在NVIDIA GeForce 940MX,2GB GPU上执行的。
已实现的XGEMM与tf.matmul运算符进行了比较。 XGEMM是真正的GEMM(可以乘以任何矩阵,而不仅仅是512的倍数...)。 通过4k输
2023-02-04 19:24:37
233KB
Python
1