FashionAI认可 天池大数据竞赛:FashionAI全球挑战赛-服饰属性标签识别竞赛源代码
2021-12-17 11:59:58 5KB 系统开源
1
mathorcup大数据竞赛a题复赛一等奖论文
2021-11-23 19:09:53 2.03MB 海量数据挖掘
mathorcup大数据竞赛一等奖初赛论文a题
2021-11-17 21:05:17 1.39MB 数据挖掘
天猫大数据竞赛——资金流入流出预测 竞赛过程中挖掘到的信息及决赛注意事项 模型选择 ARIMA (HW)+ LM 预测整月的数据 对一些特征点进行调优 (中秋,调休,国庆前) 决赛相对之前的升级: 模型方面主要是增加了数据预处理 和 线性模型中的特征; 特殊时间点方面,主要是更好的刻画了月初、月末的特征. 关于评测 如果评测机会比较充足,了解一下自己的purchase得分和redeem得分对后续方向的指导意义比较大,purchase由于比较稳定,所以得分应该更高;而redeem会因为波动比较大,预测难一些; 不要迷信用八月份的数据做线下评测得到的效果,八月份数据略坑,及早从坑里爬出来.一般来说; 评估函数不是线性的,越准确上分速度越快,加入一些小幅的噪声有可能能够提高成绩; 基本流程 需要对整体数据做一个处理,比如数据预处理、分解、汇总,这个正好使用ODPS,语法同HIVE,可以查HIVE
2021-11-14 22:51:05 13KB Python
1
2017年百度大数据竞赛原始数据获得优秀奖(10/1459)2017年的百度大数据竞赛原始数据获得优秀奖(10/1459)扩展图片2,使用fast-rcnn切割图片,将数据分为全图,狗身,狗头三部分。将三部分特征级联3,采用投票策略集成resNet,Inception,Xception和dennet等模型详见文档
2021-10-28 15:24:47 157KB 系统开源
1
天猫的真实行为数据; 182880条记录; 日期:2013年4月15日-2013年8月15日; 字段解释: user_id 用户标记,Time 行为时间,action_type 用户对品牌的行为类型 包括点击、购买、加入购物车、收藏4种行为 (点击:0 购买:1 收藏:2 购物车:3),brand_id 品牌数字ID
1
天池_大数据 阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码(2017/09/18)
2021-10-04 10:41:44 5.42MB 系统开源
1
对数据进行预处理,生成更多的训练样本。基于以上构建的训练集,训练了多个回归模型,包括:XGboost、GBDT、RandomForest、SVR(线性核与高斯核),训练时各个分仓是分别建模的。
1
“万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案 wodejiafeiyu|nano- nano- 康一帅 简介 环境 Tensorflow == 1.14.0 Keras == 2.3.1 bert4keras == 0.8.8 文件说明 EDA:用于探索性数据分析。 code/train.py:用于模型的训练。 code/infer.py:用于模型的推断(预测)。 code/utils.py:工具函数。 data:数据目录。 赛题背景分析及理解 赛题是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq
2021-06-24 20:03:44 10.89MB JupyterNotebook
1
2015年天池大数据竞赛-新浪微博互动预测大赛第一赛季最新baseine 线上baseline结果为:29.327938% 语言版本:python3.4 运行环境:eclipse 数据集:第一赛季9月17日更换后的最新数据,可到官网下载( 操作步骤: 1、在data文件下导入第一赛季最新数据weibo_train_data.txt和weibo_predict_data.txt 2、运行main.py即可,并在data下生成多个中间文件 结果:线下整体准确率为0.3002991674930433,线上整体准确率为29.327938% csdn分享地址: 版权声明:baseline为作者原创,供大家学习。
2021-06-19 10:32:32 10KB Python
1