最近跑代码在数据处理分词部分总是需要停用词表,一样一样找太麻烦了,干脆整个合集,方便后续使用。
2023-09-23 21:10:09 49KB 停用词 中文自然语言处理 分词
1
四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表 四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表 四川大学机器智能实验室停用词库+百度停用词+哈工大停用词表
2022-08-04 09:05:20 17KB 停用词
1
分词词典: 综合了百度、搜狗等词库,以及手动整理的若干人名和新近出现的热词 中文停用词: 综合了"百度停用词表","哈工大停用词表","四川大学机器学习实验室停用词表"等若干停用词表,取交集并去除了不需要的标点符号和英文单词
2021-12-04 10:12:41 21.58MB nlp 停用词
1
四川大学机器智能实验室停用词库.txt
2021-11-10 19:02:05 8KB 机器学习停用词库
文本数据挖掘——中文停用词库
2021-11-10 18:07:19 5KB 中文停用词库 文本挖掘
txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt
2021-10-12 17:16:30 9KB 分词
1
stopwords.txt
2021-09-09 13:11:45 11KB stopwords 英文停用词库 nlp
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2021-08-22 19:50:58 21KB 停用词 文本分析
1
结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表、以及网络上较大的一份无名称停用词表,整理的停用词表
2021-08-15 21:26:50 13KB 停用词
1
文本处理中使用的敏感词汇库及停用词库,停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。
2021-07-06 17:31:19 110KB 文本处理
1