pdftranspro是基于PDFBox的一款专业 pdf 文本内容提取软件,能对文档内的段落和表格进行精确提取,输出html、xml、json、txt 等 4 种格式,方便用户高效获取 pdf 文档内的精确信息或数据。其SDK版通过Java调用SDK方式仅需三行代码集成pdf文档转换功能,可返回转换文本,也提供 pdf文档截取合并等实用的 pdf 编辑功能接口。
此示例基于32 位jre 版本。如如果是64位jre,需替换pdfparser_1.dll、pdfparser_2.dll、pdfparser_3.dll这三个库文件为64位版本,下载地址为:https://download.csdn.net/download/pdftranspro/87268889
1