python读取doc文件会有问题,我也没试,就先把doc文件批量转换成docx文件,然后docx文件再另存为htm之后根据bs4再执行段落的拼接,遇到图片时直接保存,并存成自己需要的路径
1