上传者: xiyieba
|
上传时间: 2022-02-25 13:03:47
|
文件大小: 35.94MB
|
文件类型: PDF
CPU、GPU都属于冯诺依曼结构,指令译码执行、共享内存。而FPGA是无指令、无需共享内存的体系结构,这一结构使得FPGA芯片比CPU甚至GPU的能效高得多。
冯氏结构中,由于执行单元(如CPU核)可能执行任意指令,就需要有指令存储器、译码器、各种指令的运算器、分支跳转处理逻辑。由于指令流的控制逻辑复杂,不可能有太多条独立的指令流,因此GPU使用SIMD(单指令流多数据流)来让多个执行单元以同样的步调处理不同的数据,CPU也支持SIMD指令。
而FPGA每个逻辑单元的功能在重编程(烧写)时就已经确定,不需要指令。
如果使用GPU来加速,要想充分利用GPU的计算能力,batch size就不能太小,延迟将高达毫秒量级。而使用FPGA来加速的话,只需要微秒级的PCle延迟。