上传者: 42109732
|
上传时间: 2021-11-07 14:19:40
|
文件大小: 23KB
|
文件类型: -
bigclamSpark-分布
该项目由引发
还实现了Yang和Leskovec(2013)提出的BigCLAM模型,
我将大多数collectasmap和广播代码更改为rdd join,以提高资源效率和健壮性。
我使用此代码来检测网络社区,该社区在我的工作中具有数千万个节点,并且可以正常工作。
该代码的重要声明:
1.在Bigclam.scala中,graphpath文件需要包含网络中的各对边,其线由“ \ n”定界,其节点由“ \ t”定界,例如:
1 \ t2 \ n 3 \ t4 \ n
2.在Bigclam.scala中,nodeid必须在(0〜max(num_nodes)-1)范围内,其中num_nodes表示图形文件中不同节点的数量
3.使用sbt汇编来编译程序