最近跑代码在数据处理分词部分总是需要停用词表,一样一样找太麻烦了,干脆整个合集,方便后续使用。
2023-09-23 21:10:09 49KB 停用词 中文自然语言处理 分词
1
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2021-08-22 19:50:58 21KB 停用词 文本分析
1
结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表、以及网络上较大的一份无名称停用词表,整理的停用词表
2021-08-15 21:26:50 13KB 停用词
1
哈工大停用词表、中文停用词表、百度停用词表(全).zip
1
由中文停用词表:cn_stopwords.txt,哈工大停用词表:hit_stopwords.txt,百度停用词表:baidu_stopwords.txt,四川大学机器智能实验室停用词库:scu_stopwords.txt(https://github.com/goto456/stopwords)合并而得,包含2690个停用词,编码格式为utf-8,python可以直接读取。
1
百度停用词表baidu_stopwords
1
常用停用词表整理(哈工大停用词表,百度停用词表等)
2021-03-09 13:03:03 14KB 停用词表
1
百度停用词表,可以用于情感分析去停用词处理,欢迎下载使用
2019-12-21 21:45:38 9KB 停用词
1
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2019-12-21 20:03:17 21KB 停用词 文本分析
1
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2019-12-21 18:49:06 10KB 停用词 文本分析
1