【数据说明】本数据是Twitter用户的信息,包含了用户的属性、社交圈(circles)和egonetwork,数据已被做了脱敏处理。数据共有81306个用户和1768149条连边。
nodeId.edges:用户nodeId的egonetwork中的所有连边,nodeID是此egonetwork的中心节点。Twitter中的朋友关系是有方向的,比如文件中的一行元素为“a b”,就表示a关注了(follow)b,这不意味着b一定关注了a。注:nodeId并不出现在这些连边列表中,但是中心节点nodeId关注了此文件中的所有id。
nodeId.circles:用户nodeId所在的社交圈(circle),以及社交圈内的所有其他成员。每一行数据对应一个社交圈;第一列元素表示社交圈的编号。
nodeId.feat:该文件描述了在对应的nodeId.edges文件中所有出现用户的属性特征。第一列元素是用户id;从第二列开始,对应到不同维度的属性,1表示用户拥有这个属性,0则表示没有。
nodeId.egofeat:用户nodeId的属性特征。
nodeId.featnames:属性特征的名称。提供了属性特征的类别,比如教育信息、生日信息等,但是更详细的信息就被隐藏掉了。
【使用说明】需要引用J. McAuley, J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS 2012, pp. 539-547.
【源数据出处】斯坦福大学网络分析平台
2021-03-17 20:10:09
19.79MB
推荐系统
NLP
1