结巴分词用到的资源文件sougou.dict,使用方式见本人的博客。https://blog.csdn.net/JohnnyChu/article/details/100920349
2021-05-10 03:07:11 1.05MB jieba分词包 结巴分词包 sougou.dict
1
sougou预训练语料,基于字符级别的语料,大小压缩后为328m,中文预训练语料 sougou预训练语料,基于字符级别的语料,大小压缩后为328m,中文预训练语料
2021-04-27 14:39:49 321.06MB sougou
1
sogou-pinyin-1.1.0.0037-1.fc20.x86_64rpm安装包
2019-12-21 21:31:52 18.88MB 搜狗 sougou
1
在hadoop集群搭建完毕之后,可以对sougou.500w.utf数据进行分析处理,用MapReduce和Hive两种操作对所需要求的管理下得到想要看到的结果,下载压缩包里有源码,截图,文档及数据要求
2019-12-21 20:40:00 2.84MB MapReduce
1
把搜狗输入法的词库提取出来,可以为情感分析的中文分词提供自定义词库
2019-12-21 19:36:25 151KB sougou
1