jparser是一个python库,用于网页转码,也就是从html源码中抽取正文的结构化数据:文本段落和图片。目前主要针对新闻资讯类页面进行了优化。
2022-07-14 16:37:10 8KB Python开发-文本解析和操作
1
fuzzywuzzy:Python中的字符串模糊匹配
2021-09-15 15:45:51 79KB Python开发-文本解析和操作
1
unoconv:在 LibreOffice/OpenOffice 支持的任意文件格式之间进行转换
2021-09-15 14:38:11 110KB Python开发-文本解析和操作
1