目录
从 PDF 文件中提取目录 (ToC)(提取 PDF 书签)。
基于 Apache PDFBox
系统要求
Java
Java 1.8.52 编译的 PdfToc.jar
安装
复制./bin/PdfToc.jar
用法
java -jar PdfToc.jar -i "file.pdf" ["toc.txt"]
获取 ToC 并在 toc.txt 中打印:
java -jar PdfToc.jar -i "file.pdf" "toc.txt"
获取 ToC 并在标准输出中打印:
java -jar PdfToc.jar -i "file.pdf"
输出格式:
页码级标题
在哪里:
'''PageNumber''' - pdf 文件的页面。 第一个页面文件是 1(不是 0)。
'''level''' - 标题级别。 0 - 是根级别,1 - 下一级,...
例
2021-12-24 13:25:51
3.41MB
Java
1