源代码来自http://paoding.googlecode.com/svn/trunk/paoding-analysis/lib中下载的资料包,希望对大家有用
2021-05-30 16:00:21 998KB lucene jar包
1
Apache Solr 是一个开源的搜索服务器,Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一 个描述所有 Field 及其内容的 XML 文档就可以了。定制搜索的时候只需要发送 HTTP GET 请求 即可,然后对 Solr 返回的信息进行重新布局,以产生利于用户理解的页面内容布局。Solr 1.3 版 本开始支持从数据库(通过 JDBC)、 RSS 提要、 Web 页面和文件中导入数据,但是不直接支持从 二进制文件格式中提取内容,比如 MS Office、Adobe PDF 或其他专有格式。 更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。 通过对 Solr 进行适当的配置, 某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此 外,很多 Lucene 工具(如 Nutch、 Luke)也可以使用 Solr 创建的索引 Solr 的特性包括:  高级的全文搜索功能  专为高通量的网络流量进行的优化  基于开放接口(XML 和 HTTP)的标准  综合的 HTML 管理界面  可伸缩性-能够有效地复制到另外一个 Solr 搜索服务器  使用 XML 配置达到灵活性和适配性  可扩展的插件体系 1.2.1 Solr使用Lucene并且进行了扩展  一个真正的拥有动态域(Dynamic Field)和唯一键(Unique Key)的数据模式(Data Schema)  对 Lucene 查询语言的强大扩展!  支持对结果进行动态的分组和过滤  高级的,可配置的文本分析  高度可配置和可扩展的缓存机制 5/8/2011 Page 4 5/8/20112009-02-17 版权所有,侵权必究All rights reserved 第4页,共56页Page 4 , Total56  性能优化  支持通过 XML 进行外部配置  拥有一个管理界面  可监控的日志  支持高速增量式更新(Fast incremental Updates)和快照发布(Snapshot Distribution) 1.2.2 Schema(模式)  定义域类型和文档的域  能够驱动智能处理  声明式的 Lucene 分析器规范  动态域能够随时增加域  拷贝域功能允许对一个域进行多种方式的索引,或者将多个域联合成一个可搜索的域  显式类型能够减少对域类型的猜测  能够使用外部的基于文件的终止词列表,同义词列表和保护词列表的配置 1.2.3 查询  拥有可配置响应格式(XML/XSLT,JSON,Python,Ruby)的 HTTP 接口  高亮的上下文搜索结果  基于域值和显式查询的片段式搜索(Faceted Search)  对查询语言增加了排序规范  常量的打分范围(Constant scoring range)和前缀式查询-没有 idf,coord,或者 lengthNorm 因子,对查询匹配的词没有数量限制  函数查询(Function Query)-通过关于一个域的数值或顺序的函数对打分进行影响  性能优化 1.2.4 核心  可插拔的查询句柄(Query Handler)和可扩展的 XML 数据格式  使用唯一键的域能够增强文档唯一性  能够高效地进行批量更新和删除  用户可配置的文档索引变化触发器(命令)  并发控制的搜索器  能够正确处理数字类型,从而能够进行排序和范围搜索  能够控制缺失排序域的文档  支持搜索结果的动态分组 1.2.5 缓存  可配置的查询结果,过滤器,和文档缓存实例  可插拔的缓存实现  后台缓存热启:当一个新的搜索器被打开时,可配置的搜索将它热启,避免第一个结果慢 下来,当热启时,当前搜索器处理目前的请求(???)。  后台自动热启:当前搜索器缓存中最常访问的项目在新的搜索器中再次生成,能够在索引 器和搜索器变化的时候高速缓存常查询的结果 5/8/2011 Page 5 5/8/20112009-02-17 版权所有,侵权必究All rights reserved 第5页,共56页Page 5 , Total56  快速和小的过滤器实现  支持自动热启的用户级别的缓存 1.2.6 复制  能够将使用 rsync 传输时改变的索引部分有效的发布  使用拉策略(Pull Strategy)来简化增加搜索器  可配置的发布间隔能够允许对时间线和缓存使用进行权衡选择 1.2.7 管理接口  能够对缓存使用,更新和查询进行综合统计  文本
2021-05-28 09:37:34 704KB solr 企业搜索引擎 lucene query
1
视频目录: 01_lucenc简介和创建索引初步 02_lucene简介和搜索初步 03_lucene索引_创建_域选项 04_lucene索引_的删除和更新 05_lucene索引_加权操作和Luke的简单演示 06_对日期和数字进行索引 07_IndexReader的设计 08_Directory的几种操作方式 09_lucene的搜索_TermRange等基本搜索 10_lucene的搜索_其他常用Query搜索 11_lucene的搜索_基于QueryParser的搜索 12_lucene的搜索_复习和再查询分页搜索 13_lucene的搜索_基于searchAfter的实现 14_lucene的分词_分词器的原理讲解 15_lucene的分词_通过TokenStream显示分词 16_lucene分词_通过TokenStream显示分词的详细信息 17_lucene的分词_中文分词介绍 18_lucene的分词_实现自定义同义词分词器_思路分析 19_lucene的分词_实现自定义同义词分词器_实现分词器 20_lucene的分词_实现自定义同义词分词器_实现分词器(良好设计方案) 21_lucene的自定义排序 22_lucene的使用Filter 23_lucene的使用_简单复习索引、检索和分词 24_lucene的使用_自定义评分简介 25_lucene的使用_根据域进行评分设定 26_lucene的使用_自定义QueryParer解决部分查询的性能问题 27_lucene的使用_自定义QueryParer解决日期和数字范围问题 28_lucene的使用_自定义filter 29_lucene的使用_自定义filter_合理的设计方式 30_lucene的扩展_luke介绍 31_lucene的扩展_tika介绍 32_lucene的扩展_tika的第二种使用方式 33_lucene的扩展_使用tika创建索引并搜索 34_lucene的扩展_高亮基础 35_lucene的扩展_高亮索引文件 36_lucene运用到项目中_需求分析 37_lucene如何通过NRTManager和SearchManager实现近实时搜索 38_lucene在项目中的实现分析 39_lucene在项目中的实现部分Service的功能 40_lucene在项目中的实现索引重构的功能 41_lucene在留言项目中为增加和删除添加索引功能 42_lucene解决了一些开发中存在的问题(该部分视频讲解相对较乱) 43_lucene完成搜索功能(但是存在重复性的问题) 44_lucene在留言项目中使用(换了一种思路解决重复问题) 45_lucene在留言项目中添加高亮(内容会被存储) 46_lucene在留言项目中的使用(不存储内容的操作方式) 47_lucene的solr的安装 48_lucene的solr的基本使用 49_lucene的solr的增删改查和高亮 50_为留言管理项目引入solr
2021-05-18 14:04:34 69B solr视频教程 lucene教程 java教程
Lucene根据关键词出现次数排序以及自定义排序,可以自定义优先级,包含list字段排序与pom等
2021-05-13 20:02:32 43.73MB Lucene List
1
solr的IK分词器JAR及配置文件 jar包和配置文件的放置位置不一样,详情可搜索 IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。 org.wltea.analyzer.lucene.IKAnalyzer jar
2021-05-13 18:14:16 1.12MB IKAnalyzer JAR lucene solr
1
在文本框中输入要搜索的关键字,然后单击“搜一下”按钮后,系统将根据索引文件的内容自动进行搜索,将搜索的结果在页面中显示出来,并且将显示的结果中将要搜索的内容进行描红
2021-05-12 10:11:22 294KB Lucene
1
这是基于lucene搜索引擎的java源码,里面数据库,包括建立索引,增量索引一应俱全,希望对大家有作用。
2021-05-08 15:27:43 817KB lucene java
1
解决lucene4.0与IKAnalyzer的冲突。解决Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides final method tokenStream.(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;原因IKAnalyzer中参考手册中的例子是使用的lucene3.4,与4.0已经是不兼容了。本资源包含了IKAnalyzer2012_FF_hf1.jar及源码
2021-05-08 14:12:57 5.4MB lucene分词
1
基于struts2的全文检索系统,实现了文件上传和下载,并实现对上传的文件进行检索。
2021-05-07 00:10:09 31.09MB lucene 检索 索引
1
lucene-memory-3.6.2.jar包,需要的拿走
2021-05-06 10:01:34 29KB lucene jar包 提取关键词
1