本文实例为大家分享了Python批量提取PDF文件中文本的具体代码,供大家参考,具体内容如下
首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库。
import os
import sys
import time
pdfs = (pdfs for pdfs in os.listdir('.') if pdfs.endswith('.pdf'))
for pdf1 in pdfs:
pdf = pdf1.replace(' ', '_').replace('-', '_').replace('&', '_')
os.rename(pdf1, pdf)
1