四十万可用搜狗txt词库四十万可用搜狗txt词库四十万可用搜狗txt词库四十万可用搜狗txt词库
2021-08-28 00:53:50 95KB tag
1
3万8千最新最全同义近义词词库,伪原创词库精品收集整理 最新最全网上下载多个文件后整理出来!
2021-08-27 15:07:12 217KB 同义近义词
1
极爽词库6.0 for 极点五笔 绝对好用
2021-08-27 11:58:51 918KB 极点 词库 五笔
1
常用同义词词库可用于自然语言处理等领域,词列表中为每个词对应一个词,您可以通过相关逻辑把每个词的所有同义词全部提取出来
2021-08-27 09:39:10 207KB 中文 同义词 词库 同义词词林
1
谷歌拼音输入法个人词库
2021-08-25 03:13:31 51KB 词库
1
考研,学英语,新版金山词霸广告多??试试2012版金山词霸,少广告,经典界面,另有本地词库,值得你拥有
综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981
2021-08-22 19:50:58 21KB 停用词 文本分析
1
快速敏感词过滤 即将停止和移除(本项目计划于1月31日停止和移除) 本项目计划于1月31日停止和移除,请谅解,谢谢。推荐以AC自动机替代 性能概述 使用60MB大小的小说测试,单核性能超过50M字符每秒(i7 2.3GHz)。 敏感词 14553 条 待过滤文本共 599254 行,30613005 字符。 过滤耗时 0.535 秒, 速度为 57220.6字符/毫秒 其中 39691 行有替换 优化方式 主要的优化目标是速度,从以下方面优化: 敏感词都是2个字以上的, 对于句子中的一个位置,用2个字符的hash在稀疏的hash桶中查找,如果查不到说明一定不是敏感词,则继续下一个位置。 2个字符(2x16位),可以预先组合为1个int(32位)的mix,即使hash命中,如果mix不同则跳过。 StringPointer,在不生成新实例的情况下计算任意位置2个字符的hash和mix Str
2021-08-21 15:01:01 122KB Java
1
QQ机器人+词库.rar
2021-08-18 23:18:27 203KB QQ机器人
1
基于搜狗输入法制作的分词字典,整整20m,包含了各行各业的关键字,用于elasticsearch等搜索引擎自定义关键字分词词库
2021-08-17 15:03:41 20.42MB 搜狗输入法 字典 elasticsearch 词库
1