纯python编写的搜索引擎原型,适合入门学习,源代码一共1000多行。包括一个通过XML配置的多线程的网络爬虫,最简单的analyzer,indexer,query,ranker,实现了词频排序和pagerank排序。还有一个简单的服务器模型。
2021-11-30 18:23:53 29KB python 搜索引擎 爬虫 lucene
1
本Demo实现了lucene分词和查询,Dao中实现了lucene的几个基本方法.
2019-12-21 19:59:46 1.13MB 爬虫、lucene
1
实验课的项目,爬虫爬取网站内容,lucene实现索引和搜索功能,界面也很美观。爬取的是重庆大学新闻网的内容。
2019-12-21 19:25:34 12.8MB Java Web 新闻 网站
1