IJCAI-18 阿里妈妈搜索广告大赛
赛题介绍
给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR)。其中初赛预测的是普通日期的广告转化率,复赛预测的是特殊日期的广告转化率。
详细信息:
最终成绩:复赛48名
赛题分析
本赛题的正负样本比例极度不均衡,但是因为采用的是logloss评价函数,不适合抽样更改训练数据集的正负样本比,同样的有些模型的参数(比如xgb的scale_pos_weight)也是不宜用的,这些在模型的官方文档上也有说明。
单一用户的记录太少,很多用户在整个数据集中都只有一条记录,因此用户维度的特征比较难挖掘,相反商品维度的特征会更有帮助一些。
初赛与复赛由于预测的日期属性不同,造成数据分布上很大的变化。原本初赛的特征方法和模型构建方法仅仅是对复赛有
2021-09-12 11:24:00
633.29MB
Python
1