快步走
node2vec随机游走的多线程实现。
介绍
该存储库提供了node2vec随机遍历的多线程实现,并具有基于LRU缓存的别名表,它可以在有限的内存使用情况下进行处理,因此可以在单台计算机上遍历大型图。
测试了包含参数的23000个节点和2300万条边的图形
--walk_length=80 --num_walks=10 --workers=20 --max_nodes=50000 --max_edges=100000 --p=10 --q=0.01
仅使用了11GB的内存,并在2小时内完成遍历。
有关更多信息,请访问 。
先决条件
g ++ 4.8+。
用法
准备具有以下格式的输入数据:
node1 node2 [edge_weight]
node2 node3 [edge_weight]
...
默认情况下,edge_weight是1.0。
编译:
make
运行
1