Tensorflow自定义操作员代码大纲生成器
编写张量流运算符需要编写大量的样板C ++和CUDA代码。 该脚本为Tensorflow运算符的CPU和GPU版本生成代码。 更具体地,给定的tensorflow inputs , outputs和attribute s时,产生:
C ++头文件,该文件定义操作符类,以Device为模板。
定义操作员的CPU实现的C ++头文件。
具有Shape函数,REGISTER_OP和REGISTER_KERNEL_BUILDER构造的C ++源文件。
Cuda标头,用于定义操作员的GPU实现,包括CUDA内核。
Cuda源文件,带有GPU REGISTER_KERNEL_BUILDER供操作员使用。
python单元测试用例,它构造随机输入数据,并调用运算符。
Makefile,用于使用g ++和nvcc将运算符编译为共享库。
要求
1