基于字的用感知机实现的中文分词系统。完全训练后对微软的测试集精度可以达到96%多。我上传的版本是完整的代码(训练和分词),大家自己用附带的微软训练数据训练就可以了,只有一个文件。 代码总的来说写的还是很清楚的,方便自己也方便别人阅读。欢迎大家共讨论,xiatian@ict.ac.cn。
2019-12-21 21:11:02 4.92MB python 分词 感知机
1
Python分词系统jieba代码(有注释,无报错)!!!!!!!!!!!!!!!!!!!
2019-12-21 21:02:20 2KB jieba phthon 分词系统 分词
1
用C#开发的基于正向和逆向最大匹配的分词程序。
2019-12-21 20:08:26 72KB 分词 正向最大匹配 逆向最大匹配 FMM
1
nlpir 汉语分词系统(使用java封装整理) 可实现词频,词性,分词、情感预判、聚类授权等大数据相关算法。
2019-12-21 19:29:30 23.53MB 分词 词频 聚类授权
1
hmm实现的中文分词系统; 一个简单的宋词生成系统; 包括一个简单网页界面;
1
功能强大的在线分词系统,可以用于搜索引擎的开发
2019-12-21 18:58:01 272KB 在线 分词 设计
1
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。这是该软件的2015版本,欢迎各位学者下载使用。
2019-12-21 18:56:33 49.06MB ICTCLAS2015
1
在最新版的中科分词系统基础上,进行了改进,加入用户词典和停用词,并进行文件无乱码读写,输出分词结果,效果不错,是情感分析的良好基础。这一部分,我用来写作为硕士论文的数据处理基础。在此分享给各位,欢迎指教
2019-12-21 18:49:57 3KB 分词系统 用户词典 停用词
1