上传者: 27595745
|
上传时间: 2021-09-06 17:18:56
|
文件大小: 2.36MB
|
文件类型: PDF
1、Hadoop 业界资讯......................................... - 1 -
2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究 ........... - 5 -
3、支持自定义爬虫的Nutch segment文件存储接口改写........... - 11 -
4、Nutch中mapreduce应用的几个特殊点 ...................... - 14 -
5、Java RMI + Lucene 构建分布式检索应用初探 ................ - 17 -
6、一对多的表关联在mapreduce中的应用(续) .................. - 26 -
7、InputSplit文件格式分析................................. - 32 -
8、短评:HDFS、MapReduce和HBase三者相辅相成、各有长处 ..... - 34 -
9、HDFS在web开发中的应用................................. - 35 -
10、Mapreduce中value集合的二次排序 ....................... - 38 -
11、Hive SQL手册翻译 ................................... - 47 -
12、Mahout Kmeans简介 .................................... - 57 -