上传者: 42128141
|
上传时间: 2022-10-08 16:15:35
|
文件大小: 277.11MB
|
文件类型: ZIP
GROBID
GROBID文档
请访问以获取更多详细信息。
概要
GROBID(或Grobid,但不是GroBid或GroBiD)表示书目数据的生成。
GROBID是一个机器学习库,用于将原始文档(例如PDF)提取,解析和重组为结构化XML / TEI编码的文档,尤其侧重于技术和科学出版物。 最早的发展始于2008年,是一种业余爱好。 在2011年,该工具已以开源形式提供。 自开始以来,作为副项目的GROBID工作就一直稳定,并有望继续进行。
可以使用以下功能:
从PDF格式的文章中提取标题并进行解析。 这里的摘录涵盖了通常的书目信息(例如标题,摘要,作者,隶属关系,关键字等)。
从.