中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
2020-01-03 11:24:35 3.63MB 中文分词 最大匹配
1
Java实现分词(正向最大匹配和逆向最大匹配)两种方法实现
2019-12-21 21:03:41 5KB java分词
1
中文分词词典 适合最大正向匹配算法使用 共计548389条词语
1
用C#开发的基于正向和逆向最大匹配的分词程序。
2019-12-21 20:08:26 72KB 分词 正向最大匹配 逆向最大匹配 FMM
1