搜狗词库新词发现算法、常见的工具类、百度应用、翻译、天气预报、汉语纠错、字符串文本数据提取时间解析、实体抽取等等
2021-11-10 21:39:38 1.61MB 算法
1
2020年的所有搜狗词库,已经全部处理为txt格式的纯汉字。可以直接提供给IK使用,如果有编码问题,重新保存为UTF-8
2021-09-07 18:06:56 129.72MB 搜狗 词库 ik IKAnalyzer
1
最近做了些关于关键词(敏感词)过滤、lucene搜索方面的编码工作,整理了一些词库,共享给大家,希望用得着。所有词库都是纯文本格式的。
2021-07-06 17:37:04 255KB 搜狗 词库 敏感词 停用
1
分词算法词库,搜狗词库(200W+27W+40W)
2021-06-18 19:09:18 10.54MB 分词算法词库 搜狗词库
1
法律分词库,主要是针对搜狗词库中较新的词库进行了整合,并添加了人名以及裁判文书中针对人名所作的隐私屏蔽。如王某之类的表述。
2021-06-17 09:01:41 1.59MB 法律 人名 搜狗词库
1
搜狗网站下载词库网页容易崩,所以提前下载了一些,包括:通信,计算机,网络,编程,成语大全,篮球,绘画,美术,高中常考诗词,NBA,电影,王者荣耀等
2021-05-23 16:08:35 2.78MB 搜狗词库
1
搜狗的汉语,IT行业,计算机行业,金融行业的词库收集
2021-05-13 09:16:42 3.39MB 搜狗 词库
1
爬取搜狗 2020-3-23 的所有字条,700 多 w 条。只有 txt文件,12 个大类别,文件夹下对应是各个大类别下的小类别,压缩文件 108 m。可用于 es 扩展中文词库
2021-05-08 17:04:50 103MB 搜狗词库 es 中文字库
1
转换为txt版UTF8且格式已修改为一行一词的搜狗金融词库,可直接导入作为jieba的自定义词库使用
2021-04-22 19:02:12 165KB jieba txt 搜狗词库 金融词库
1
搜狗词库整理,不到2万个TXT文件,每个文件有若干词汇,一共大约3000W+的词汇,若想合并一个TXT,和通过:开始--运行--cmd--进入到文件夹--执行命令【type *.txt > d:\a.txt】。 全文检索拆词的较好选择
2021-04-21 18:07:56 161.56MB 搜狗词库 txt格式 搜索拆词
1