Ansj中文分词 #####使用帮助 #####在线测试地址 摘要 这是一个基于google语义模型+条件随机场模型的中文分词的java实现. 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 目前实现了.中文分词. 中文姓名识别 . 用户自定义词典 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目. 下载jar 访问 最好下载最新版 ansj_seg/ 如果你用的是1.x版本需要下载。 如果你用的是2.x版本需要下载 导入到eclipse ,开始你的程序吧 maven 第一步在你的pom.xml中加入. .... mvn-repo http://
2024-03-30 13:19:36 43.84MB Java
1
庖丁解牛中文分词,速度不错,词库也很全面,非常不错!
2024-01-15 14:26:38 5.83MB 中文分词 lucene
1
技术支持:support@shootsoft.net http://www.shootsoft.net 平台:.Net1.1 C# + dotlucene 1.9.0.2 ShootSearch是一个c#编写的基于dotlucene的开源搜索引擎.其目标是能够检索http,ftp,本地,本地网络邻居四类资源. 已经完成http部分. 测试DEMO: 新浪&搜狐首页开始所有www开头的主机,13分钟54.5 MB 985个文件 60个文件夹 索引文件12MB. 可以在这里查看http://www.shootsoft.net/dotlucene在线测试. 支持微软标准IFilter,支持自己写插件. 没有使用自己写的分词程序,时间不是很充足... dotLucene下的高亮显示好像有问题,不是很好用
2024-01-11 21:38:42 2.66MB dotlucene lucene
1
自己做的一个中文分词,可以用在MONO下。根据IKAnalyzer Java版本移植到C#。采用了Powercollection类库。
2023-12-10 05:01:43 1.92MB 中文分词 LUCENE
1
lucene in action 第二版(pdf) MEAP Edition Manning Early Access Program
2023-11-06 16:33:56 4.11MB lucene lucene action
1
Lucene 原理与代码分析,学习Lucene必备资料
2023-10-17 14:20:00 4.73MB Lucene 原理
1
Lucene 3.0 原理与代码分析完整版 讲得挺好的,由浅入深的讲检索技术层次剥开,值得好好学习
2023-10-17 14:10:02 8.75MB Lucene 3.0 原理 代码
1
人民邮电出版社 邱哲 符滔滔 王学松 编著 《开发自己的搜索引擎Lucene+Heritrix第二版》随书光盘,绝对完全。里面包含了书里面的所有Java源代码和所需jar包,希望对大家有用。由于源文件太大,所以我将其分卷压缩为两部分,请大家务必下载part1与part2成功之后放在同一个文件夹中解压。
2023-05-22 17:49:13 18.32MB 搜索引擎 随书光盘 Lucene Heritrix
1
搜索引擎的JAVA实现,包含源代码,非常不错呦.
2023-04-28 21:11:49 869KB lucene 搜索引擎 JAVA
1
基于MySQL和Lucene的反向索引系统的实时性能比较研究,刘一洲,徐鹏,搜索引擎是当今互联网使用最频繁的应用之一。为用户提供及时的,甚至是实时的信息索引是当今搜索引擎所要面对的首要挑战。倒排索
2023-03-29 21:31:00 375KB 倒排索引
1