solr7.x ikanalyzer pinyin 分词。亲测solr7.3.1可用。
2019-12-21 20:14:47 1.31MB solr solr7 iknalyzer 拼音
1
1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5、IkSegmentation.java(样例类)
2019-12-21 20:14:24 3.22MB 中文分词 IK Analyzer
1
汉语语料库,包含9000多个文本,涵盖新闻、论文、散文、小说等多种类型的文本,经过了分词和词性标注的精加工。
2019-12-21 20:13:19 31.68MB 语料库
1
30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com 想省资源分可以到http://www.5eyi.com/download-sphinx-chinese-word-lexicon-collected/下载
1
最新整理 盘古分词 dct词库文件 共720592条数据,文件大小:24.6M
2019-12-21 20:11:37 24.7MB dct 盘古分词 词库
1
使用visual studio 开发的lucene.net和盘古分词实现全文检索。并按照lucene的得分算法进行多条件检索并按照得分算法计算匹配度排序。 可以输入一句话进行检索。 lucene.net的版本为2.9.2 盘古分词的版本为2.3.1 并实现了高亮功能。高亮上使用的是盘古分词的高亮算法。 有点小bug,在这个字段没有关键字的时候可能会不显示数据, 如果要是只看全文检索,可以自己去掉高亮,看一下检索结果。
2019-12-21 20:10:11 2.24MB lucene.net 盘古分词 C#
1
这是一个关于CRF的源代码,能直接来用,欢迎广大朋友下载
2019-12-21 20:09:27 354KB CRF
1
用C#开发的基于正向和逆向最大匹配的分词程序。
2019-12-21 20:08:26 72KB 分词 正向最大匹配 逆向最大匹配 FMM
1
本书介绍了信息处理用现代汉语分词词表的收词原则和方法,《信息处理用现代汉语分词规范》设计原则及规范内容,中文文本歧义切分技术等内容。
2019-12-21 20:06:49 3.02MB 文本挖掘 文本标注 自然语言处理 分词
1
中文词典 NLP ,收录45159条中文词语,每行一个用 /n 隔开,方便拆分使用 哀怜 哀鸣 哀戚 ... 曝光 曝光表 曝露
2019-12-21 20:06:39 295KB 中文词典 中文分词
1