python批量word转txt(无视文档损坏/不需要依赖库/1秒300个)

上传者: 39804265 | 上传时间: 2021-04-22 21:53:48 | 文件大小: 1KB | 文件类型: PY
对于没有损坏的word可以用网上常见的教程通过win32com库转换为txt,我的电脑实测约为1.34秒/个文档。对于文档损坏的docx文档,无法借助代码打开office的(没损坏的也可以),使用这个代码,读取xml的文本数据,进行文档转换,实测约为300个文档/秒(也许更快,但是我没有这么多word文档)。【使用方法:将需要转换的文档放入passage文件夹(如有需要变更可以改程序代码),将程序放在passage文件夹外,自动转换所有文件夹内的docx文件,命名为同名+"_xml2txt"的txt文档,文件夹内允许有其他格式文件存在,实测每秒300个】

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明