超大规模用户数据挖掘和推荐算法 最新进展 (1)数据规模、挑战; (2)KDD-CUP 2012; (3)KDD-CUP 2012 Solution 剖析; (4)数据挖掘和推荐的新趋势;
KDD CPU99 数据集,已经经过处理,适合于二分类问题比如说异常检测。 已经分好了训练集与测试集,分别是两个文件。
2021-08-07 21:07:54 2.66MB 异常检测
1
kdd_cup99部分数据的分类整理。
2021-07-21 16:53:16 1.54MB kdd_cup
1
17年阿里天池 Data Description The road network (Figure 1) here used is a directed graph formed by interconnected road links (Figure 3). A route (Figure 4) in the network is represented by a sequence of links. For every road link, its vehicle traffic comes from one or more “incoming road links” and goes into one or more “outgoing road links”. Table 3 and Figure 3 describe road links.
2021-04-16 18:02:16 9.86MB KDDCUP2017
1
kddcup.data_10_percent
2021-04-01 11:12:50 2.05MB kdd_cup_99
1
微博推荐数据集kddcup2012-track1
2021-03-16 16:17:25 615.13MB 推荐数据集,推荐系统,大数据
1
KDD-CUP是公认的数据处理领域内的最高水平的赛事之一,竞赛所用数据往往被数据挖掘初学者用作数据处理训练之用。这是2009年KDD-CUP竞赛所使用数据的small版,非常适合初学者使用。仅供分享
2020-01-03 11:35:47 16.09MB KDD-CUP 数据挖掘 2009
1
NSL-KDD是KDD Cup 1999数据集的重采样版本,training set和test set分别采用(125973, 41) 和(22544, 41)的数据。在training set中,normal : abnormal = 67343 : 58630,解决了KDD99中类别不均衡的问题。
2019-12-21 20:48:11 2.33MB KDD 数据集 网络安全
1
KDD CUP 99的一部分数据,分为有标签的和未标签的。方便做初步研究。
2019-12-21 20:33:33 12.69MB KDDCUP99 数据
1
KDD Cup 1998年竞赛的目标是估计一个直邮的回复量,以便获得最多的捐款。数据集的格式是以逗号作为分隔符,其中学习数据集”cup98lrn.txt”包含了95412条记录,481个字段,验证数据集“cup98val.txt”包含了96367条记录,479个字段。每条记录都包含一个CONTROLN字段,该字段是记录的唯一标识符;有两个目标变量TARGET_B和TARGET_D,TARGET_B是一个二进制变量,表示当一条记录中的TARGET_D变量中有捐款时,该条记录是否对邮件做了回复。学习数据集和验证数据集的数据格式相同,但是在验证数据集中没有包含TARGET_B和TARGET_D这两个
2019-12-21 20:32:05 34.88MB 数据集
1