何谓自动分词自动分词就是将用自然语言书写的文章、句段经电子计算机处理后,以词为单位给以输出,为后续加工处理提供先决条件。此技术对于信息分析、情报检索、机器翻译、数据库管理和人工智能等IT应用方面有着关键性的作用。 自动分词的实现,对于拉丁语系来说并不困难,其语言文字的形成结构中,词与词之间本身就有着明显的间隔符(如:空格、标点符号等),但对于中文来说,就是一个至今仍未能得以很好解决的技术难题,中文词与词之间没有着明显的间隔符,甚至连标点符号都没有的古文更是为难了。当今,国内外IT界的一些仁人志士们还在为此技术不懈努力着。
2022-01-26 17:37:06 1.25MB 中文
1
excel自动分词,调用第三方接口,高速稳定
2021-11-22 22:36:11 912KB excel 分词
1
java语言实现的中文自动分词软件,包含工程源码、可执行文件以及测试文件。该分词程序的切词正率和召回率较高。
2021-10-24 18:37:59 3.6MB 中文自动分词 自然语言处理 java
1
新词识别问题的解决方案主要有两种,一种是基于概率统计的,另一种是基于规则的。本文在两者的基础上,实现统计与规则相结合的新词识别检测问题。首先从熟语料中构建N元组候选词库,然后对候选词库分别进行规则过滤,互信息过滤以及位置成词率过滤,再经过N元组重叠标记得到各自不同的新词表。最后综合三种方法,实现统计与规则相结合的新词识别算法,实验结果表明新词识别准确率达到88%。
2021-10-24 16:44:03 924B 汉语自动分词
1
百度竞价推广关键词自动分词工具,wps可用,需启用宏
2021-08-12 09:04:41 317KB 百度竞价 百度推广
1
分词工具,关键词自动分词,SEO关键词自动分词,采集关键词自动分词,划分根词,长尾词,问答词,百科词,均可以一键分词
2021-07-17 21:55:31 55KB 分词工具
1
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-06-25 09:04:28 15KB 分词算法 KNN文本分类算法 python
本资源包括源代码,ppt,技术报告,能够实现中文的自动分词,词性标注。代码是java编写,用eclipse工具实现。是我们自然语言的课程设计。供大家之用
2021-05-06 09:42:45 7.34MB 中文 自动分词 词性标注 java
1
这是一个好用的中文分词软件。。。。。。。 支持自动标引,自动分词。。。。。。。。 支持全文检索。。。。。 还有统计功能
2021-04-21 10:21:38 7.31MB 中文分词 自动标引 自动分词 分词
1