词库包括有200W左右的最新词,这个词库作为搜索引擎分词的标准。
2019-12-21 19:59:11 15.82MB 词库 搜狗 资源
1
本文利用搜狗搜索日志的500w条数据,对搜索日志进行了一系列的分析。主要分为两个阶段,第一阶段是数据准备、数据预处理和数据加载阶段,第二阶段为分析阶段。利用Hive等工具,完成30页的分析报告。
2019-12-21 19:55:55 1.05MB 搜狗日志分析 Hadoop hive Cloudera
1
搜狗输入法x86版本,支持安装在Android studio模拟器中
2019-12-21 19:43:39 18.33MB 搜狗x86版本
1
搜狗输入法的词库提取出来,可以为情感分析的中文分词提供自定义词库
2019-12-21 19:36:25 151KB sougou
1
搜狗统计分析,ssh框架,将hadoop离线分析的数据进行报表展示。 博客地址:http://www.cnblogs.com/biehongli/p/8074642.html
2019-12-21 19:28:33 2MB 搜狗统计
1
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
2019-12-21 19:21:49 16.3MB 语料库;分词
1
搜狗的词库 带词语 词性 词频 自然语言处理之必备良药
2019-12-21 18:56:00 1.11MB 词库 自然语言处理
1
搜狗的细胞词库是一个开放共享的词库,本程序是使用python获取搜狗词库官网上的所有下载链接,下载词库并进行分类保存。需要注意的是,下载过来的文件格式为:.scel 如果要转换为.txt,欢迎查看我的另一个下载资源。欢迎下载交流!
2019-12-21 18:54:17 2KB 搜狗词库 爬虫 批量下载 分类
1
自己从网上下载的搜狗旅游词汇大全,如有冒犯,请联系删减。
2019-12-21 18:53:59 108KB 旅游
1
该工具是一个python程序,你只需要运行python 输入搜狗词库源安装包路劲就可以把scel安装包转化成txt
2019-12-21 18:53:09 2KB python scel txt
1