1.克隆源码 https://github.com/microsoft/DeepSpeed.git
2.在win10系统22H2版本上安装Visual Studio 2019,在支持GTX1060显卡的NVIDIA Studio Driver462.31驱动上安装cuda11.6+cudnn8.7,进入在python3.7的虚拟环境中,安装依赖pytorch1.12.0
3.更改源码
3.1.setyup.py增加环境变量
os.environ['DS_BUILD_AIO']='0'
os.environ['DS_BUILD_SPARSE_ATTN']='0'
3.2.csrc/includes/memory_access_utils.h增加头文件
#include
4.执行编译命令 python setup.py bdist_wheel ,大约20分钟后在dist目录生成deepspeed-0.8.2+81b4d5db-cp37-cp37m-win_amd64.whl文件
1