新闻搜索引擎
使用方法
安装python 3.4+环境(推荐或 )
安装lxml html解析器,命令为pip install lxml
安装jieba分词组件,命令为pip install jieba
安装Flask Web框架,命令为pip install Flask
进入web文件夹,运行main.py文件
:浏览器,访问输入关键字开始测试
如果想抓取最新新闻数据并编制索引,一键运行./code/setup.py ,再按上面的方法测试。
2020.4.5:添加抓取的爬虫程序。先运行./code/spider.chinanews.com.py爬取最近5天新闻(约2500条);然后注释./
1