读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行 读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2021-03-31 09:13:42 4KB C++ 倒排索引 信息检索
1
山东大学大数据课程的实验二。基于hadoop集群系统(也可以在伪分布式系统上运行)系统使用Java编写的倒排索引实现,具有使用停词表功能,使用正则表达式选择规范的单词。代码重构了setup(),map(),combiner(),partitation()和reducer()函数,功能是对文档进行倒排索引,得到一个单词有序,且单词的文件列表同样有序的倒排列表集合。
2020-05-11 22:24:38 6KB 倒排索引 大数据 Java hadoop
1
读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2020-01-03 11:37:42 3KB C++ 倒排索引 信息检索
1
本项目是基于hadoop搜索引擎的离线处理程序,主要包含三部分 1.网页信息过滤 2.生成倒排索引文件 3.生成二级索引文件;
2020-01-03 11:25:41 30.11MB hadoop 搜索引擎 倒排表
1
C语言实现的倒排索引算法(含全部源码)
2020-01-03 11:23:12 2KB c语言
1
程序用java编写后向算法中文分词分词,并建立倒排索引表。然后在myeclipse下编写一个web形式的搜索测试页。
2019-12-28 17:56:36 2.7MB 倒排索引 搜索引擎 java 中文分词
1
倒排索引(Inverted Index)被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是目前几乎所有支持全文索引的搜索引擎都需要依赖的一个数据结构。资源中包含了MapReduce实现的文档倒排索引的源码、jar包、测试数据(包含停词表)和结果。
2019-12-28 17:16:03 3.55MB MapRed Java Hadoop SDU
1
这是一个在hadoop集群环境下的文档倒排程序。数据源是莎士比亚文集(运行是需要设置)
2019-12-21 22:01:55 6KB Hadoop 并行框架
1
author:July thanks:ys,fuxiang。 本系统源码是个人原创文章系列,程序员编程艺术第二十六章:基于给定的文档生成倒排索引的编码与实践的整个工程源码 look:http://blog.csdn.net/v_july_v/article/details/7109500 windows下VS2010,linux环境下皆已测试通。 且只限于学习研究之用,请勿作其它用途。 如果你能将本系统改进优化,并能反馈与我,我将感激不尽。谢谢。 email:zhoulei0907@yahoo.cn page:http://blog.csdn.net/v_JULY_v/。
2019-12-21 21:33:00 2.01MB 程序员编程艺术 倒排索引
1
这是山东大学大数据实验二,用Hadoop实现文档的倒排索引
2019-12-21 20:04:21 11KB Hadoop 大数据 倒排索引
1