该API将Java包装到HTTP API中,以从HTML页面提取原始文章文本。 用法 有两种使用API​​的方法。 您可以传递url或原始html: curl -X POST http://localhost:3000/extract -H " Content-Type: application/json " -d ' { "url": "http://techcrunch.com/2014/07/07/matterport-16m-dcm/" } ' curl -X POST http://localhost:3000/extract -H " Content-Type: application/json " -d ' { "html": "YOUR HTML CODE HERE" } ' 跑步 运行API的最简单方法是使用Docker。 可在blik
2021-12-21 17:02:09 1.26MB Scala
1
过该工具即可得到想要的正文信息,例如提取各大门户网站的新闻,历史,娱乐等的正文信息。
2021-05-29 12:38:59 105KB 正文提取 boilerpipe
1