结巴分词,jieba分词,统计分词出现的频率,按频率统计分词出现的频率。分词器功能,建议参考 elasticsearch的分词器,此分词器为入门级的分词拆分和分词频率统计
2019-12-21 20:36:08 6.44MB jieba分词 java 分词统计 结巴
1
自己搜集来的词典,有重复的一些,自己甄别,里面包了清华大学词典,台湾大学词典,知网词典等,褒义词,贬义词,情感词一类的,反正挺多的
1
使用R语言中的jiebaR包,对中文文本进行分词,求词频,做词云图并进行LDA主题建模
2019-12-21 20:30:20 4KB LDA jieba
1
为了项目,自建的词库,包括心理学,物理学,生物学等。
2019-12-21 20:21:05 2.2MB 深度学习
1
Java使用结巴分词时,必须应用的 jar包。应用于 分词器
2019-12-21 20:16:32 2.09MB 资源包
1
使用Python,对爬取微博的评论,进行jieba分词,统计词频,修改路径即可。
2019-12-21 19:33:13 835B jieba 分词 微博评论
1
Python Jieba中文分词工具实现分词功能,Python Jieba中文分词工具实现分词功能
2019-12-21 18:57:53 126.01MB jieba Python
1
金融方面的常见词汇形成的词典/语料库,jieba.load_userdict()即可使用
2019-12-21 18:53:33 15KB NLP 语料库 jieba 分词词典
1
因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
2019-12-21 18:53:25 7.15MB python jieba
1
jieba和百度分词词库;
2019-12-21 18:53:13 2.51MB jieba词库 百度分词词库 分词词库
1