OFD解析器 OFD(开放式固定格式文档)
2022-12-22 14:17:55 43KB Kotlin
1
tika-python 绑定到 Apache Tika REST 服务 Python binding to the Apache Tika REST services Apache Tika 库的 Python 端口,可使用 Tika REST 服务器使 Tika 可用。这使得 Apache Tika 可作为 Python 库使用,可通过 Setuptools、Pip 进行安装,并且易于安装。要使用这个库,您需要在系统上安装 Java 7+,因为 tika-python 在后台启动 Tika REST 服务器。- 特征 解析器接口(在 REST 之前向后兼容) 解析器接口使用 /rmeta 接口提取文本和元数据 或者,您可以将 Tika 服务器 URL 与对多实例执行有用的调用一起传递 指定 XHTML 的输出格式 解包接口在一次调用中处理元数据和文本提取 在内部返回内部解包的元数据和文本条目的 tarball
2022-05-27 14:01:39 61KB python apache tika-python TikaREST
1
编译tika源文件最难找的jar包,好像很多人都找不到,找了一天才找到
2021-08-02 22:31:33 13.36MB openxmlformats lucene tika
1
一款可以轻松提取文本正文的工具,它集成了POI, Pdfbox,并且为文本抽取工作提供了一个统一的界面,提供了便利的扩展API,用来丰富其对第三方文件格式的支持,需要的朋友欢迎前来下载使用!
2021-03-16 19:04:04 73.75MB jar document
1
Tika in Action 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
2019-12-21 18:55:40 16.49MB Tika Action
1