这是《高校云计算应用创新大赛》里的最后一道题,题目是莎士比亚文集词频统计并行化算法。由于原网站上的实验文件已经无法下载了,所以这里上传一份,包含 shakespear.zip、stopword.txt.
2022-03-15 16:07:47 1.96MB shakespear stopword
1
对于初级或者中级研究这个词表还是挺好用的,基本的中英文停用词和符号等都能去掉,可能如果做到深度研究这个词表还是有点瑕疵
2022-03-06 16:07:40 24KB 停用词 文本处理 stopword
1
中英文停用词stop_words,共3018个
2021-11-25 18:01:56 23KB 停用词 stopword nlp 数据预处理
1
stopword 中文停用词 做文本分类器所需要的。 stopword 中文停用词 做文本分类器所需要的。
2021-11-12 11:31:05 3KB stopword 中文停用词
1
本资源为机器学习实验五5.3:中文词预处理 的酒店评论数据集pos、neg、stopword,仅供备份。编码utf-8。无需积分,获取提取码即可下载。
2021-11-04 15:06:31 6.07MB 机器学习
1
solr搜索引擎,停止词
2021-08-05 20:02:21 15KB solr 搜索引擎 停止词
1
ik,elasticsearch,停词,词库,stopword.dic
2021-08-05 19:05:58 33KB 停词 IKAnalyzer 全文索引
1
哈工大停用词表、中文停用词表、百度停用词表(全).zip
1
内涵3000多个中文停用词,很有用。希望能够帮到大家,仅限个人学习使用,若有其他用途,后果自负。:总的来看 总的来说 总的说来 总而言之 总之 纵 纵令 纵然 纵使 遵照 作为 兮 呃 呗 咚 咦 喏 啐 喔唷 嗬 嗯
2021-05-31 20:44:52 26KB 中文停用词
1
该文档内有已经总结好的所有常见停用词,适用于数据分析、数据挖掘方面,尤其是分析用户情感、拆分用户评论、商品评价等方面,对于去除数据的冗余性有很大的作用,可与jieba库一起使用
2021-03-05 12:27:47 15KB 停用词 情感分析 数据分析
1