solr集成IK分词,动态扩展词及停用词实现,动态添加到solr词库中,无需重建solr索引,更无需重启solr服务啦
2021-02-05 17:05:24 9.24MB solr ik分词 词库管理 ik-analyzer-8.3
1
lucene源码包(这里包括了lucene所有能用到的jar包,一共44个jar包)3.6.2版本是lucene的3x中最大的版本,也是3x中最稳定的版本,因此建设使用该版本。如果还是使用3.6.0或3.6.1,更要升级到该版本,因为该版本修复了部分以前版本的BUG。下面列出几个常用到的包:lucene-core-3.6.2.jar、lucene-memory-3.6.2.jar、lucene-highlighter-3.6.2.jar、lucene-analyzers-3.6.2.jar、lucene-queries-3.6.2.jar、lucene-benchmark-3.6.2.jar
2021-02-04 11:05:01 90.78MB lucene 3.6.2 中文分词器
1
lucene全文检索,IKAnalyzer分词jar包,IKAnalyzer2012_u6.jar
2021-02-04 11:04:59 1.11MB IKAnalyzer 中文分词器jar包 IKAnalyzer2012
1
最权威的中文文本分词语料 可用于文本分词 分词语句达20万句
2021-01-29 20:46:29 12.22MB 1998 人民日报 分词 语料
1
基于语义检索的目的,结合成语典故本体的构建,设计了一个基于成语典故本体的语义检索模型,阐述了检索模型中用户界面模块、数据存储模块、查询分析模块和检索分析模块的功能;分析了系统中的本体构建技术、分词技术及检索技术,设计并实现了词语相似度及概念相似度算法;通过语义检索系统的实验,得到较高的查全率和查准率。
1
个人整理的区块链常用词汇字典,大概有300多个词汇,可以用jieba直接导入作为分词数据来源,jieba.load_userdict()
2021-01-28 05:05:52 5KB 区块链 去中心化 分词 NLP
1
Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
2021-01-28 05:00:42 98.25MB elasticsearch ik分词器 kibana
1
nlp各个领域的新词发现,词库寻找
2021-01-28 04:57:36 339.46MB 搜狗 词库 新词 分词
1
IK分词器通过spark加载词典,并在spark中使用
2021-01-28 04:17:06 33KB spark es hive
1
这是一个完整的代码,里面的eclipse整合了elasticsearch和hdfs大数据平台,可以用于搜索,IK分词等功能。
2021-01-28 04:00:18 38.64MB elasticsearch ES和IK分词 eclipse和es es和hdfs
1