最近跑代码在数据处理分词部分总是需要停用词表,一样一样找太麻烦了,干脆整个合集,方便后续使用。
2023-09-23 21:10:09 49KB 停用词 中文自然语言处理 分词
1
四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表 四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表 四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表
2022-08-04 09:05:20 17KB 停用词
1
四川大学机器智能实验室停用词库.txt
2021-11-10 19:02:05 8KB 机器学习停用词库
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2021-08-22 19:50:58 21KB 停用词 文本分析
1
结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表、以及网络上较大的一份无名称停用词表,整理的停用词表
2021-08-15 21:26:50 13KB 停用词
1
常用停用词表
2021-06-30 18:08:30 7KB NLP
1
由中文停用词表:cn_stopwords.txt,哈工大停用词表:hit_stopwords.txt,百度停用词表:baidu_stopwords.txt,四川大学机器智能实验室停用词库:scu_stopwords.txt(https://github.com/goto456/stopwords)合并而得,包含2690个停用词,编码格式为utf-8,python可以直接读取。
1
四川大学机器智能实验室停用词库scu_stopwords
1
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2019-12-21 20:03:17 21KB 停用词 文本分析
1
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2019-12-21 18:49:06 10KB 停用词 文本分析
1