16万常用词库,清华大学11种开放词库带词频。可以用于自然语言处理在分词方面的研究学习用。 我是用C++进行分词,使用速度很快,几乎感觉不到查找时间。
2021-07-05 20:24:40 1.75MB 中文分词 词库 带词频
1
hadoop上的中文分词IKAnalyzer.zip
2021-07-05 19:04:50 6.4MB IKAnalyzer linux 中文分词
1
输入任意一篇中文文档,能够分析出里面可能的词组,然后输出,输入的文档越多,结果越准确, 不需要外部字典,输出的重点词汇用"*"开头,可以调整关键参数来调整准确率,附完整的源代码和测试文档(输入 的学习文档必须以ANSI编码保存,因为目前没有加入icu字符处理,并且固定了输入文档的文件名 命名规则,每个输入文档必须以file开头,后面跟连续的数字序号,从0开始,比如file0, file1, file2, file3 。。。输入的学习文档和测试程序的可执行文件需要在同一目录)
2021-07-01 09:50:18 31KB 智能 中文 分词 源码
1
北邮 计算机院 自然语言处理 中文分词程序
2021-07-01 09:30:11 5.8MB 自然语言处理 中文分词
1
基于Python语言的中文分词技术的研究.pdf
2021-06-28 20:04:28 2.28MB Python 程序 软件开发 论文期刊
分词词库是一个搜索引擎中非常重要的一部分,为基于词典分词的算法提供了分词依据。
2021-06-28 18:28:06 392KB 分词词库
1
Sequence labeling base on universal transformer (Transformer encoder) and CRF; 基于Universal Transformer CRF 的中文分词和词性标注
2021-06-25 15:54:54 97KB Python开发-自然语言处理
1
中文分词文件(共20W个词)
2021-06-23 14:06:47 1.75MB 中文分词
solr 中文分词器 ik-analyzer-solr7-7.x.jar ik-analyzer-8.4.0.jar
2021-06-22 19:08:18 20.94MB 中文分词器
1
CNN-RNN中文文本分类,基于TensorFlow 环境 Python 2/3 (感谢howie.hu调试Python2环境) TensorFlow 1.3以上 numpy scikit-learn scipy
2021-06-21 19:40:22 407KB py 人工智能 AI 中文分词
1