flask_whoosh:一个简单的 python Flask 应用程序,它运行一个数据抓取器和一个 Whoosh 搜索引擎实现

上传者: 42099815 | 上传时间: 2023-04-12 22:45:09 | 文件大小: 35KB | 文件类型: ZIP
烧瓶嗖嗖嗖嗖 一个简单的 python Flask 应用程序,它运行一个数据抓取器和一个 Whoosh 搜索引擎实现。 我写这篇文章主要是为了从 RSS 提要中抓取财经新闻(标题、出版日期时间、简要摘要),并将数据索引到 Whoosh 搜索引擎中。 只是一个尝试新事物的小爱好项目。 先决条件 BeautifulSoup - 烧瓶 - Whoosh - 以上所有都可以通过pip安装。 例如。 'pip 安装 Whoosh' 指示 1.安装需要的依赖2.添加你想抓取的RSS提要的url,即。 第 85 行,server.py。 请注意,您可能必须更改 scrape() 以迎合特定 RSS 提要的 XML 3. 使用“python server.py”运行服务器。 Flask 的默认端口为 5000 数据应该被抓取和索引,新文件将被添加到“/data”文件夹 用法 1. 要搜索特定术语,请

文件下载

资源详情

[{"title":"( 27 个子文件 35KB ) flask_whoosh:一个简单的 python Flask 应用程序,它运行一个数据抓取器和一个 Whoosh 搜索引擎实现","children":[{"title":"flask_whoosh-master","children":[{"title":"index","children":[{"title":"MAIN_WRITELOCK <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"MAIN_bstdsi5w216cdvpt.seg <span style='color:#111;'> 70.66KB </span>","children":null,"spread":false},{"title":"_MAIN_1.toc <span style='color:#111;'> 1.24KB </span>","children":null,"spread":false}],"spread":true},{"title":"server.py <span style='color:#111;'> 3.17KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 1.80KB </span>","children":null,"spread":false},{"title":"error_log.log <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"global.txt <span style='color:#111;'> 2B </span>","children":null,"spread":false},{"title":"data","children":[{"title":"16 <span style='color:#111;'> 260B </span>","children":null,"spread":false},{"title":"5 <span style='color:#111;'> 290B </span>","children":null,"spread":false},{"title":"1 <span style='color:#111;'> 293B </span>","children":null,"spread":false},{"title":"14 <span style='color:#111;'> 280B </span>","children":null,"spread":false},{"title":"8 <span style='color:#111;'> 295B </span>","children":null,"spread":false},{"title":"7 <span style='color:#111;'> 293B </span>","children":null,"spread":false},{"title":"4 <span style='color:#111;'> 276B </span>","children":null,"spread":false},{"title":"11 <span style='color:#111;'> 280B </span>","children":null,"spread":false},{"title":"2 <span style='color:#111;'> 279B </span>","children":null,"spread":false},{"title":"6 <span style='color:#111;'> 294B </span>","children":null,"spread":false},{"title":"10 <span style='color:#111;'> 279B </span>","children":null,"spread":false},{"title":"12 <span style='color:#111;'> 296B </span>","children":null,"spread":false},{"title":"20 <span style='color:#111;'> 289B </span>","children":null,"spread":false},{"title":"3 <span style='color:#111;'> 284B </span>","children":null,"spread":false},{"title":"19 <span style='color:#111;'> 293B </span>","children":null,"spread":false},{"title":"15 <span style='color:#111;'> 282B </span>","children":null,"spread":false},{"title":"13 <span style='color:#111;'> 276B </span>","children":null,"spread":false},{"title":"17 <span style='color:#111;'> 251B </span>","children":null,"spread":false},{"title":"9 <span style='color:#111;'> 290B </span>","children":null,"spread":false},{"title":"18 <span style='color:#111;'> 280B </span>","children":null,"spread":false}],"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明