天猫大数据竞赛——资金流入流出预测 竞赛过程中挖掘到的信息及决赛注意事项 模型选择 ARIMA (HW)+ LM 预测整月的数据 对一些特征点进行调优 (中秋,调休,国庆前) 决赛相对之前的升级: 模型方面主要是增加了数据预处理 和 线性模型中的特征; 特殊时间点方面,主要是更好的刻画了月初、月末的特征. 关于评测 如果评测机会比较充足,了解一下自己的purchase得分和redeem得分对后续方向的指导意义比较大,purchase由于比较稳定,所以得分应该更高;而redeem会因为波动比较大,预测难一些; 不要迷信用八月份的数据做线下评测得到的效果,八月份数据略坑,及早从坑里爬出来.一般来说; 评估函数不是线性的,越准确上分速度越快,加入一些小幅的噪声有可能能够提高成绩; 基本流程 需要对整体数据做一个处理,比如数据预处理、分解、汇总,这个正好使用ODPS,语法同HIVE,可以查HIVE
2021-11-14 22:51:05 13KB Python
1
2017年百度大数据竞赛原始数据获得优秀奖(10/1459)2017年的百度大数据竞赛原始数据获得优秀奖(10/1459)扩展图片2,使用fast-rcnn切割图片,将数据分为全图,狗身,狗头三部分。将三部分特征级联3,采用投票策略集成resNet,Inception,Xception和dennet等模型详见文档
2021-10-28 15:24:47 157KB 系统开源
1
天猫的真实行为数据; 182880条记录; 日期:2013年4月15日-2013年8月15日; 字段解释: user_id 用户标记,Time 行为时间,action_type 用户对品牌的行为类型 包括点击、购买、加入购物车、收藏4种行为 (点击:0 购买:1 收藏:2 购物车:3),brand_id 品牌数字ID
1
天池_大数据 阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码(2017/09/18)
2021-10-04 10:41:44 5.42MB 系统开源
1
对数据进行预处理,生成更多的训练样本。基于以上构建的训练集,训练了多个回归模型,包括:XGboost、GBDT、RandomForest、SVR(线性核与高斯核),训练时各个分仓是分别建模的。
1
“万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案 wodejiafeiyu|nano- nano- 康一帅 简介 环境 Tensorflow == 1.14.0 Keras == 2.3.1 bert4keras == 0.8.8 文件说明 EDA:用于探索性数据分析。 code/train.py:用于模型的训练。 code/infer.py:用于模型的推断(预测)。 code/utils.py:工具函数。 data:数据目录。 赛题背景分析及理解 赛题是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq
2021-06-24 20:03:44 10.89MB JupyterNotebook
1
2015年天池大数据竞赛-新浪微博互动预测大赛第一赛季最新baseine 线上baseline结果为:29.327938% 语言版本:python3.4 运行环境:eclipse 数据集:第一赛季9月17日更换后的最新数据,可到官网下载( 操作步骤: 1、在data文件下导入第一赛季最新数据weibo_train_data.txt和weibo_predict_data.txt 2、运行main.py即可,并在data下生成多个中间文件 结果:线下整体准确率为0.3002991674930433,线上整体准确率为29.327938% csdn分享地址: 版权声明:baseline为作者原创,供大家学习。
2021-06-19 10:32:32 10KB Python
1
包含了天池大数据竞赛的移动推荐算法和资金流预测竞赛的实现源码和ppt讲解
2021-06-08 22:37:11 39.93MB 大数据
1
该手册上面详细讲解了,大数据环境搭建,hadoop、hive、mysql等,还有相关比赛的题目和解决方法。
1
2015年3月23日,阿里云计算宣布启动新一赛季的天池大数据竞赛。大赛将吸引全球新生代数据科学家,为预测手机党购物喜好、余额宝资金流动、时尚穿衣搭配,提供更精准的数据分析模型。
2021-03-22 19:28:41 1.11MB 大数据 天池 比赛经验
1