网上关于xpdf提取文本的资料都是linux系统下的,连官网下载的使用说明也是linux系统的,看你们一个个怪可怜的,我整理了一个windows系统下的程序和配置,源码下载解压后直接运行useage.bat就把目录里的1.pdf的文本保存为1.txt,剩下的读取txt就很简单了。右键编辑useage.bat文件可以看见命令行,命令行格式:pdftotext.exe -layout -enc GBK -cfg add-to-xpdfrc 要读取的pdf文件路径 保存成txt文件路径
2021-10-29 18:05:46
1.41MB
pdf读取
1