用Java编写的中文分析算法设计与实现,对比分析了, 正向最大匹配法(FMM),逆向最大匹配法(BMM),双向最大匹配法的优缺点,实验报告请参见我的CSDN博客
2021-04-06 22:30:11 1.42MB Java 中文分词 课程设计 算法设计
1
中文分词源代码,java语言。以及词典txt文本。代码通过读词典获取数据,进行中文分词。将词典读取的数据利用map去重,然后进行前缀扫面,详情见博客:https://blog.csdn.net/qq_40142391/article/details/82945556#commentsedit
2021-04-05 13:34:14 202KB 中文分词 词典(txt
1
CRF++的使用 CRF用于中文分词-附件资源
2021-04-04 12:49:59 23B
1
南华大学实验报告(可拿90分以上) 包括实验作业5和6(实验作业7和8见博主另一篇资源) 实验作业5:设计并实现一个中文分词的算法 实验作业6:提交一篇中文分词的实验报告(要求与实验作业5中算法相对应),资料中上传了实验报告模板和实例。
2021-04-02 12:06:31 57KB 搜索引擎 大数据
关于隐马尔科夫模型,最大熵,条件随机场模型的理论综述及其他们之间的优缺点 比较简单希望对大家有用
2021-04-01 19:17:42 355KB 条件随机场 最大熵 中文分词
1
包含GaussianNB、马尔科夫模型、文本分类、中文分词的代码且数据和示例。
2021-03-31 15:31:04 2.08MB 贝叶斯网络 马尔科夫模型 中文分词
1
最大逆向匹配的中文分词(附人民日报语料),并计算了准确率与召回率
2021-03-31 14:41:24 32.93MB 分词 逆向 人民日报
1
Scala中文分词+SparkML逻辑回归 实现 中文文本分类
2021-03-25 19:13:54 13.89MB SparkML Scala中文分词
1
结巴中文分词停用表,整合百度分词、哈工大等停用词表2000余条数据 即拿即用,效果好,提升分词速度准确率。
2021-03-25 14:23:10 16KB 中文分词 分词停用表 结巴分词
1
将源码做部分修改,打成jar包,适合于lucene3.6版本。注意paoding-dic-home.properties的配置
2021-03-22 23:41:19 107KB 庖丁 分词器 中文分词
1