stopwords.txt
2024-05-17 16:27:40 17KB 停用词表
1
用于中文分词的停用词列表。 在我的python专栏的文章《2020年上半年过去了,来给日记画个词云图呀~》https://blog.csdn.net/crack6677/article/details/107074014中用到的就是这个停用词列表文档。
2023-09-16 10:29:40 16KB 停用词
1
解决nltk.stopwords的下载速度过慢,同时在原有停用词的的基础上加入了一些小语种的停用词,例如马来语、印尼语、菲律宾语,有助于小语种的nlp任务。
2023-01-08 23:32:42 21KB nltk stopwords
1
中文停用词
2022-08-22 21:05:32 11KB 中文停用词
1
中文停用词表,共3185个停用词,该列表是本人搜集了网上目前比较热门的中文停用词表然后去重后又根据自己的实际业务人工添加了三四百个停用词得到的。
2022-06-16 00:21:03 20KB 中文分词停用词 停用词表
1
包含了simhei.ttf和cn_stopwords.txt两个文件,一个练习的配套的文件打包。文件来源网络,如有侵权,请联系删除,谢谢!
2022-06-13 02:26:37 4.52MB cn_stopwords simhei.ttf
1
哈工大停用词
2022-05-31 16:15:04 5KB 停用词
http://www.nltk.org/nltk_data/ 上下载的stopwords.zip,解决nltk.download("stopwords")无法成功的问题
2022-05-01 23:51:35 23KB nltk stopwords
1
这是nltk_data\corpora下的stopwords文件,nltk_data-gh-pages在网上下载了好久才下载下来,取出里面的stopwords.zip供大家使用
2022-02-17 12:45:38 17KB nltk
1
压缩包里含四个文本文档 1、符号stopWord.txt (1KB) 2、英文stopWord.txt (3KB) 3、中文stopWord.txt (8KB) 4、集合stopWord.txt (11KB) 其中第四个文档是前三个文档的集合。 此是本人实验过程中搜集整理的结果(以前的老版本加上自己整合的)。 已做预处理等,保证不重复。
2022-02-06 22:53:59 11KB NLP 应删除词 stopwords 停用词表
1