代码对10个txt文件进行分词、去除停止词,并提取每个词的tfidf特征值输出
2019-12-21 18:56:12 1.32MB IK分词 tfidf特征
1
大数据时代,中文的语义分析变得非常重要,这是一个可以中文分词的小插件,由武大沈阳教授团队开发的。
2019-12-21 18:56:10 8.61MB rost cm
1
java实现中科大ICTCLAS2015分词,源代码和jar包之前都有提供。
2019-12-21 18:56:04 964KB ICTCLAS java
1
百度分词词库,做百度SEO的技术开发,用了它扛扛的,亲,你懂的
2019-12-21 18:55:54 407KB 百度分词词库
1
JAVA版本的比C版本功能更加强大全面!建议大家下载使用,注意请配置WIN32环境下的java
2019-12-21 18:55:34 7.58MB 中科院分词
1
中文敏感词库、各种停用词表以及各种分词词库,txt格式方便实用
2019-12-21 18:55:31 21.62MB 敏感词库 停用词 各种词库
1
香港城市大学语料库(1 772 202 字,训练集)、微软亚洲研究院语料库(1 089 050 字,训练集)、北京大学语料库(1 833 177 字,训练集)
2019-12-21 18:55:23 41.84MB 分词语料库
1
这是目前来说最新的ansj分词jar包,导入即可使用
2019-12-21 18:55:21 6.64MB ansj;分词
1
结巴分词包软件
2019-12-21 18:54:23 11.83MB 结巴分词包软件
1
用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
2019-12-21 18:53:49 16.62MB NLP NER
1