网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明
2021-06-16 14:05:59 901KB java 搜索 源码
1
本系统以SpringBoot基础框架整合其他技术设计和搭建而成,选用webmagic框架实现单节点的网络爬虫系统,爬虫的生命周期为链接提取、页面下载、内容抽取、持久化,多线程抓取,Redis队列和集合实现网页去重和增量抓取。搜索引擎的索引和搜索系统是利用全文搜索引擎框架(ElasticSearch)构建,由IK分词器实现语句分词地功能,ElasticSearch是一个企业分布式、高扩展、高实时的搜索与数据技术分析处理引擎,可以用于搜索各种文当,它提供可扩展的搜索,具有高效的海量数据搜索、分析和探索的能力。最后实现一个简单的web搜索页面,来模拟搜索引擎客户端
2021-05-15 17:12:39 246KB ElasticSearch webmagic java 搜索引擎
1
Java搜索引擎的研究与实现(含文档+源码)目录 1摘要 3第一章 引言 4第二章 搜索引擎的结构 52.1系统概述 52.2搜索引擎的构成 52.2.1网络机器人 52.2.2索引与搜索 52.2.3 Web服务器 62.3搜索引擎的主要指标及分析 62.4小节 6第三章 网络机器人 73.1什么是网络机器人 73.2网络机器人的结构分析 73.2.1如何解析HTML 73.2.2 Spider程序结构 83.2.3如何构造Spider程序 93.2.4如何提高程序性能 113.2.5网络机器人的代码分析 123.3小节 14第四章 基于lucene的索引与搜索 154.1什么是Lucene全文检索 154.2 Lucene的原理分析 154.2.1全文检索的实现机制 154.2.2 Lucene的索引效率 154.2.3 中文切分词机制 174.3 Lucene与Spider的结合 184.4小节 21第五章 基于Tomcat的Web服务器 225.1什么是基于Tomcat的Web服务器 225.2用户接口设计 225.3.1客户端设计 225.3.2服务端设计 235.3在Tomcat上部署项目 255.4小节 25第六章 搜索引擎策略 266.1简介 266.2面向主题的搜索策略 266.2.1导向词 266.2.3权威网页和中心网页 276.3小节 27参考文献 28
2021-05-12 23:37:20 872KB J2EE 源代码 java 搜索引擎
1
Java搜索引擎里面的代码要用到很精确的算法和数据结构,此资料很适合编程的朋友去看,尤其是对开发搜索引擎的朋友有极大的帮助....
2021-05-07 20:53:22 902KB java j2ee 源码
1
Spring Boot结合Jest实现对ElasticSearch的全文检索,分词检索,分页,高亮关键词,多字段检索 PageController中的搜索方法里面是全套的,分词,分页,高亮等都包含,数据格式个es-head中创建索引的索引在压缩包里面都有 还是不懂的可以看我的博文里面有详细的介绍
2021-05-05 11:14:38 257KB springboot elasticsearch java 搜索引擎
1
本项目为搜索广告系统中的AdServer模块
2021-03-09 15:05:37 452KB java 广告系统 广告
1
lucene 中文分词小案例,实现中文检索,最近看到lucene顺便自己动手做了一下感觉挺实用的,案例很简单,很容易看懂
2019-12-21 22:22:58 21.15MB lucene java搜索引擎 中文分词
1
java搜索引擎,主要实现功能是根据输入的地址抓取网页上的mp3音乐文件,存入数据库,提供给用户进行搜索和试听,代码根据网上资料自行整理编写而成,代码保证可以用,注释齐全,数据为sqlserver2005,都一并在包里,对于想研究java搜索引擎的应该有一定参考作用。
2019-12-21 20:30:54 2.49MB java 搜索引擎 代码
1
通过Java API操作ElasticSearch的应用实例,具体解析详情请参见博文:http://blog.csdn.net/l1028386804/article/details/78758691
2019-12-21 20:04:51 18KB ES Java 搜索
1