哈工大停用词表 川大智能实验室停用词表 中文停用词词表
2022-02-06 14:11:22 9KB python 自然语言处理 开发语言 后端
1
在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!
2022-01-30 17:40:38 21KB TF-IDF 停用词
1
整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
2022-01-21 17:55:12 5.53MB NLPIR 分词 过滤停用词
1
es5.3.2热词、停用词、同义词词典,包括插件压缩包,插件源码,远程词典服务端示例,配置说明等
2022-01-20 14:01:16 8.32MB es热词 es同义词 es远程词典
1
自然语言处理常用到的停用词去除一些无用词
2022-01-08 19:07:13 23KB 停用词 自然语言处理 分词
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用亲测可用, 谢谢支持。
2022-01-06 21:58:11 70KB 词频计算
1
| 中文停用词表 | cn\_stopwords.txt | | 哈工大停用词表 | hit\_stopwords.txt | | 百度停用词表 | baidu\_stopwords.txt | | 四川大学机器智能实验室停用词库 | scu\_stopwords.txt |
2022-01-06 18:28:11 13KB NLP 自然语言处理 停用词
1
英文停用词表,1000个停用词左右,满足大部分的去停用词情况
2022-01-05 16:49:20 7KB 去停用词
1
中文停用词表、哈工大停用词表、百度停用词表、四川大学机器智能实验室停用词
2021-12-30 09:08:14 13KB 停用词 stopwords 自然语言处理 nlp
1
适用于分词、nlp等过程的英文停用词
2021-12-29 23:16:10 7KB 分词 nlp python 停用词
1