java开发web搜索引擎源码
es
elasticsearch+hbase海量数据查询,支持千万数据秒回查询
博客地址:
一、ElasticSearch和Hbase
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful
web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。 Elasticsearch的性能是solr的50倍。
HBase
–
Hadoop
Database,是一个高可靠性、高性能、面向列、可伸缩、
实时读写的分布式数据库
–
利用Hadoop
HDFS作为其文件存储系统,利用Hadoop
MapReduce来处理
HBase中的海量数据,利用Zookeeper作为其分布式协同服务
–
主要用来存储非结构化和半结构化的松散数据(列存
NoSQL
数据库)
二、需求分析&服务器环境设置
主要是做一个文章的搜索。有文章标题、作者、摘要、内容四个主要信息。效果图
2022-02-24 10:33:54
104.73MB
系统开源
1