压缩包里含四个文本文档 1、符号stopWord.txt (1KB) 2、英文stopWord.txt (3KB) 3、中文stopWord.txt (8KB) 4、集合stopWord.txt (11KB) 其中第四个文档是前三个文档的集合。 此是本人实验过程中搜集整理的结果(以前的老版本加上自己整合的)。 已做预处理等,保证不重复。
2022-02-06 22:53:59 11KB NLP 应删除词 stopwords 停用词表
1