由于工作的需要,拿到一批含有几百张表的加密xlsx文件,需要对其汇总进行分析,使用pandas 的read_excel()方法读取时, 提示XLRDError: Can't find workbook in OLE2 compound document错误, 发现是由于xlsx加密的缘故,由于所有表数据均是一个密码,因此用下面方法进行进行解密数据进行输出。如果是 每个单表数据对应的密码不唯一, 有个猜想,可以吧文件和对应的密码生成一个dict,在每次读取添加密码的时候,可以根据文件进行自动获取密码。下面是标文件密码相同的解密方法。
import win32com.client
import p
1