网页排名
使用 mapreduce 实现页面排名算法
该程序将计算输入文件中每个网页的页面排名
src文件夹中的PageRank.jar文件(在develop分支)可以通过以下方式使用:
hadoop PageRank.jar PageRank.PageRank input_path output_path中间路径
-参数
input_path is the folder containing input file(s)
output_path is the folder containing final output file(s)
intermediate_path is the folder containing all intermediate files generated during the run
-输入文件格式
page_id_1: page1_neighbor1,
2022-05-28 13:34:22
3KB
Java
1