nlpir 汉语分词系统(使用java封装整理) 可实现词频,词性,分词、情感预判、聚类授权等大数据相关算法。
2019-12-21 19:29:30 23.53MB 分词 词频 聚类授权
1
分词大词库,共366万,普通情况下,足够用。这是我在做分词项目时,足足找了3天才找到的上等资源。比起那些弄点资源然后收5C币要强得多。
2019-12-21 19:29:17 22.91MB 分词
1
程序利用中科院的软件,分词、词性标注以后聚类,利用tf-idf值求出30个特征性,生成特征向量,可放在weka中聚类!
2019-12-21 19:28:15 5.25MB 中文分词、词性标注,聚类
1
hmm实现的中文分词系统; 一个简单的宋词生成系统; 包括一个简单网页界面;
1
access的分词词库,从网络搜集的近40万词汇,num字段代表关键词的热度
2019-12-21 19:25:54 5.17MB 中文分词 分词词库 中文搜索
1
中文分词词库中文分词词库中文分词词库中文分词词库中文分词词库
2019-12-21 19:24:35 7.46MB 中文分词词库
1
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
2019-12-21 19:21:49 16.3MB 语料库;分词
1
IK 分词器 2012版本
2019-12-21 18:58:50 2.05MB IK 分词器 2012版本
1
Lucene提取新闻关键词Top-N JDK版本要求1.7,lucene版本要求5.5.3 使用说明: 1、在IndexDocs.java右键run as java application 2、在GetTopTerms.java右键run as java application
2019-12-21 18:58:08 8.72MB 分词 词频 Lucene IK分词
1
功能强大的在线分词系统,可以用于搜索引擎的开发
2019-12-21 18:58:01 272KB 在线 分词 设计
1