人民邮电出版社 邱哲 符滔滔 王学松 编著 《开发自己的搜索引擎Lucene+Heritrix第二版》随书光盘,绝对完全。里面包含了书里面的所有Java源代码和所需jar包,希望对大家有用。由于源文件太大,所以我将其分卷压缩为两部分,请大家务必下载part1与part2成功之后放在同一个文件夹中解压。
2023-05-22 17:49:13 18.32MB 搜索引擎 随书光盘 Lucene Heritrix
1
Java搜索引擎 Lucene
2022-06-06 14:02:18 60.08MB lucene 搜索引擎 java 全文检索
1、资源内容:毕业设计lun-wen word版10000字+;开题报告,任务书 2、学习目标:快速完成相关题目设计; 3、应用场景:课程设计、diy、毕业、参赛; 4、特点:直接可以编辑使用; 5、使用人群:设计参赛人员,学生,教师等。 6、使用说明:下载解压可直接使用。 7、能学到什么:通过学习本课题的设计与实现, 学习内部架构和原理,为后续的创作提供一定的设计思路和设计启发 , 同时也为后续的作品创作提供有力的理论依据、实验依据和设计依据, 例如提供一些开源代码、设计原理和电路图等有效的资料,而且本设计简单, 通俗易通,易于学习,为不同使用者提供学习资源,方便快捷, 是一种有效且实用的,同时也是一份值得学习和参考的资料。
2022-04-14 14:06:10 1.43MB 搜索引擎 lucene ajax
开发自己的搜索引擎-Lucene 2.0+Heritrix 。包里有《开发自己的搜索引擎-Lucene 2.0+Heritrix》的电子书以及书中的源代码。还有一个自己写的一个简单的应用实例,对学习搜索引擎的朋友应该是很有帮助的。
2022-03-30 22:10:19 6.78MB 搜索引擎 lucene heritrix
1
【完整光盘24.5M】开发自己的搜索引擎-Lucene 2.0+Heritrix.zip 评论+评分后即可返回1分。。O(∩_∩)O 。。谢谢支持。。
1
此中型搜索引擎由ShootSearch优化而来,所有版权仍归ShootSearch所有,同时感谢原作者尹君。
2021-11-10 09:36:30 8.46MB 搜索引擎 Lucene
1
java源码:Java搜索引擎 Lucene.zip
2021-10-14 09:02:56 60.08MB java 源码 经典
基于 Lucene 与 Nutch web搜索引擎
2021-05-31 08:22:48 9.58MB 搜索引擎,lucene
1
Apache Solr 是一个开源的搜索服务器,Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一 个描述所有 Field 及其内容的 XML 文档就可以了。定制搜索的时候只需要发送 HTTP GET 请求 即可,然后对 Solr 返回的信息进行重新布局,以产生利于用户理解的页面内容布局。Solr 1.3 版 本开始支持从数据库(通过 JDBC)、 RSS 提要、 Web 页面和文件中导入数据,但是不直接支持从 二进制文件格式中提取内容,比如 MS Office、Adobe PDF 或其他专有格式。 更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。 通过对 Solr 进行适当的配置, 某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此 外,很多 Lucene 工具(如 Nutch、 Luke)也可以使用 Solr 创建的索引 Solr 的特性包括:  高级的全文搜索功能  专为高通量的网络流量进行的优化  基于开放接口(XML 和 HTTP)的标准  综合的 HTML 管理界面  可伸缩性-能够有效地复制到另外一个 Solr 搜索服务器  使用 XML 配置达到灵活性和适配性  可扩展的插件体系 1.2.1 Solr使用Lucene并且进行了扩展  一个真正的拥有动态域(Dynamic Field)和唯一键(Unique Key)的数据模式(Data Schema)  对 Lucene 查询语言的强大扩展!  支持对结果进行动态的分组和过滤  高级的,可配置的文本分析  高度可配置和可扩展的缓存机制 5/8/2011 Page 4 5/8/20112009-02-17 版权所有,侵权必究All rights reserved 第4页,共56页Page 4 , Total56  性能优化  支持通过 XML 进行外部配置  拥有一个管理界面  可监控的日志  支持高速增量式更新(Fast incremental Updates)和快照发布(Snapshot Distribution) 1.2.2 Schema(模式)  定义域类型和文档的域  能够驱动智能处理  声明式的 Lucene 分析器规范  动态域能够随时增加域  拷贝域功能允许对一个域进行多种方式的索引,或者将多个域联合成一个可搜索的域  显式类型能够减少对域类型的猜测  能够使用外部的基于文件的终止词列表,同义词列表和保护词列表的配置 1.2.3 查询  拥有可配置响应格式(XML/XSLT,JSON,Python,Ruby)的 HTTP 接口  高亮的上下文搜索结果  基于域值和显式查询的片段式搜索(Faceted Search)  对查询语言增加了排序规范  常量的打分范围(Constant scoring range)和前缀式查询-没有 idf,coord,或者 lengthNorm 因子,对查询匹配的词没有数量限制  函数查询(Function Query)-通过关于一个域的数值或顺序的函数对打分进行影响  性能优化 1.2.4 核心  可插拔的查询句柄(Query Handler)和可扩展的 XML 数据格式  使用唯一键的域能够增强文档唯一性  能够高效地进行批量更新和删除  用户可配置的文档索引变化触发器(命令)  并发控制的搜索器  能够正确处理数字类型,从而能够进行排序和范围搜索  能够控制缺失排序域的文档  支持搜索结果的动态分组 1.2.5 缓存  可配置的查询结果,过滤器,和文档缓存实例  可插拔的缓存实现  后台缓存热启:当一个新的搜索器被打开时,可配置的搜索将它热启,避免第一个结果慢 下来,当热启时,当前搜索器处理目前的请求(???)。  后台自动热启:当前搜索器缓存中最常访问的项目在新的搜索器中再次生成,能够在索引 器和搜索器变化的时候高速缓存常查询的结果 5/8/2011 Page 5 5/8/20112009-02-17 版权所有,侵权必究All rights reserved 第5页,共56页Page 5 , Total56  快速和小的过滤器实现  支持自动热启的用户级别的缓存 1.2.6 复制  能够将使用 rsync 传输时改变的索引部分有效的发布  使用拉策略(Pull Strategy)来简化增加搜索器  可配置的发布间隔能够允许对时间线和缓存使用进行权衡选择 1.2.7 管理接口  能够对缓存使用,更新和查询进行综合统计  文本
2021-05-28 09:37:34 704KB solr 企业搜索引擎 lucene query
1
解密搜索引擎技术实战Lucene&Java精华版(第3版)源码 书名:解密搜索引擎技术实战Lucene&Java精华版(第3版) 作者:罗刚 等编著 出版社:电子工业出版社 关键词:Lucene solr 搜索引擎 Lucene实战 随书源码 本书随书光盘文件有1G,压缩后有>400MB, 我单个文件的权限是80MB 故分为下面6个包上传: 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(1) 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(2)-补第5章p1 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(3)-补第5章p2 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(4)-补第6章 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(5)-libp1 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码(6)-libp2 第5章是文件最大的章节,需要分录成2个文件 p1是源码,p2是测试数据excel文件 第6章是次大的章节,单独1个文件 光盘中所有的jar已经去重放在了lib目录,>80MB,分了2个文件,libp1放了大部分jar,libp2放了三个大jar
2019-12-21 20:00:45 35.33MB Lucene solr 搜索引擎 Lucene实战
1