es中文分词器7.10.0
2021-06-09 17:06:20 4.17MB es中文分词器7.10
1
mmseg4j中文分词器 mmseg4j-core-1.10.0.jar mmseg4j-solr-2.3.0.jar两个主要依赖包
2021-06-07 17:01:56 15KB mmseg4j中文分词器
1
ES: elasticsearch-7.9.3-linux-x86_64.tar ik分词器:elasticsearch-analysis-ik-7.9.3.zip 可视化插件:elasticsearch_Head谷歌插件.rar
2021-06-04 19:06:30 296.96MB ES Elasticsearch Elasticsearch中文分
1
springboot-dev.zip ik7.12.4.zip
2021-05-26 19:03:30 4.35MB ES
1
je-analysis-1.5.1分词器, je-analysis-1.5.1分词器, je-analysis-1.5.1分词器
2021-05-25 22:18:56 872KB je-analysis-1.5.1 JE分词器
1
Friso高性能中文分词器框架源码,包含开发文档。 Friso 是使用 c 语言开发的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现。源码无需修改就能在各种平台下编译使用,加载完 20 万的词条,内存占用稳定为 14.5M. **Friso**核心功能: - [x] 中文分词:mmseg算法 + **Friso** 独创的优化算法,四种切分模式。 - [ ] 关键字提取:基于textRank算法。 - [ ] 关键短语提取:基于textRank算法。 - [ ] 关键句子提取:基于textRank算法。 # **Friso**中文分词: ### 四种切分模式: - [x] 简易模式:FMM 算法,适合速度要求场合。 - [x] 复杂模式- MMSEG 四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 - [x] 检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.6.1版本开始)。 - [ ] 最多模式:细粒度切分,专为检索而生,除了中文处理外(不具备中文的人名,数字识别等智能功能)其他与复杂模式一致(英文,组合词等)。 ### 分词功能特性: - [x] 同时支持对 UTF-8/GBK 编码的切分,支持 php5 和 php7 扩展和 sphinx token 插件。 - [x] 支持自定义词库。
elasticsearch-analysis-ik-6.0.0.tar.gz
2021-05-21 11:01:05 4.09MB elasticsearch analysis ik分词器 中文分词器
IK Analyzer是一个开源的,基于java诧言开发的轻量级的中文分词工具包. IK Analyzer安装包包含: 1. 《IKAnalyzer中文分词器V3.X使用手册》 2. IKAnalyzer3.X.jar(主jar包) 3. IKAnalyzer.cfg.xml(分词器扩展配置文件) 4. ext_stopword.dic(扩展的stopword词典,3.2以上版本提供) 它的安装部署十分简单,将IKAnalyzer3.X.jar部署于项目的lib目录中;IKAnalyzer.cfg.xml 与 ext_stopword.dic 文件放置在代码根目录(对于 web 项目,通常是 WEB-INF/classes 目录,同hibernate、log4j等配置文件相同)下即可。
2021-05-19 02:02:14 1.97MB IKAnalyzer JAVA sorl
1
IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。
2021-05-13 19:15:29 1.11MB IK-Analyzer Solr
1
es+kibana+analysis-ik.zip
2021-05-10 18:02:56 580.41MB es kibana 分词器
1