在elasticsearch 中默认提供的分词器是对中文不友好的,所以我们需要额外的 进行安装一个中文的分词
2022-10-14 19:25:04 4.3MB elasticsearch 大数据 big data
1
elasticsearch7.6.1-ik分词
2022-10-12 18:38:02 3.14MB elasticsearch
1
预训练语言模型,可用于文本分类等NLP任务,序列标注任务,情感分析任务,采用业界通用的技术实现,接下游文本分类,序列标注,情感分析等任务,性能良好
2022-10-12 14:57:35 547KB 语言模型
1
IKAnalyzer 分词器支持中文分词多元分词
2022-10-03 21:39:08 5.7MB IKAnalyzer
1
人民日报统计出来的用于自然语言处理的中文词典
2022-10-02 19:02:52 626KB 自然语言处理 词性标注 中文分词
1
这是一篇关于自然语言处理的论文,介绍了汉语分词的n-gram算法,绝对值得推荐
2022-09-28 21:40:47 1.09MB n-gram 机器学习 汉语分词
1
本篇文章则着重分析 ElasticSearch 在全文搜索前如何使用 ik 进行分词,让大家对 ElasticSearch 的全文搜索和 ik 中文分词原理有一个全面且深入的了解。 全文搜索和精确匹配
2022-09-22 19:00:09 568KB 技术
1
采取基于N-最短路径方法的中文词语粗分模型对中文文本进行粗切分,采取Viterbi算法对切分结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别
2022-09-15 18:24:19 345KB 中文分词 中国人名 N最短路径
1
luke-all是查询lucense生成索引文件的工具,加入IK分词器,更好的支持中文查询
2022-08-24 10:51:38 8.09MB lukeall IK分词器
1
elasticsearch-analysis-pinyin-7.4.0 es拼音分词器7.4.0
2022-08-22 09:27:16 7.69MB elasticsearch 大数据 big data
1