#IJCAI 2018 阿里妈妈广告预测算法 背景 本项目是天池的一个比赛,由阿里妈妈和天池大数据众智平台举办广告预测算法大赛,本次参赛人数多达5200多,而我们只取得了731的成绩,最遗憾的是当我们写好CNN预测结果准备上传,发现队伍被强制解散,只因为的大神队友忘记实名注册,没心很无奈,又非常不甘心,但是这就是规则,我们只有遵循的权利,难过伤心之后还是需要把整个项目进行整理总结。 目标 本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad, context
2023-01-23 23:07:15 436KB Python
1
IJCAI-2018 数据集,包括初赛及复赛的数据。
2022-07-27 10:26:28 30.49MB IJCAI
1
环境需求 运行环境 python2.7 Anaconda 4.0 Jupyter notebook 外部依赖库 numpy pandas sklearn statsmodels 文件 data 用于存储所有的数据,包括原始数据,额外数据,处理后的数据,模型中间数据以及最后提交的结果。 results 存储模型和规则预测出的最终结果。 shop_info_name2Id 将商店中的地址、三级分类等名词映射成Id保存在该文件夹下。 statistics 原始数据处理后的数据,包括平滑后的数据,天气数据和天气统计。 test_train 存储线下线上train和test的特征以及标签文件。 weekABCD 线下线上训练集和测试集的划分,按日分。 weekABCD_0123 线下线上训练集和测试集的划分(将一天分为四个时间段,没六小时一个时间段)。 main 主要的数据预处理代码和模型,以及数据分析代码。 analysis 数据分析的代码和统计结果。 data_processing 数据预处理,包括数据统计,数据预处理,数据平滑,训练集和测试集划分。 avg_smooth
IJCAI-18 阿里妈妈搜索广告转化预测总结(0.13966,53/5204) 赛题内容 本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad, context, shop)。 结合淘宝平台的业务场景和不同的流量特点,我们定义了以下两类挑战: 日常的转化率预估 特殊日期的转化率预估 评估指标 数据挖掘流程 数据探索与特征使用方案:业务逻辑和特征覆盖率 数据采样:样本采样与过滤 根据特征使用方案构造特征:基础特征、平稳特征、动态特征、高阶特征、文本特征、偏好
2022-06-24 22:04:49 452KB JupyterNotebook
1
自己整理的IJCAI2018自然语言处理方向的论文,总共95篇,有感兴趣的可以一阅。
2022-06-21 13:49:27 45.35MB IJCAI NLP 自然语言处理 机器学习
1
Role2Vec ⠀ ⠀ 基于学习角色的图嵌入的可扩展并行gensim实现(IJCAI 2018) 。 抽象的 随机游走是许多现有网络嵌入方法的核心。 但是,这样的算法由于使用随机游走而具有许多局限性,例如,由于这些方法所产生的特征与顶点身份相关联,因此无法转移到新的节点和图上。 在这项工作中,我们介绍了Role2Vec框架,该框架使用了归因于随机游走的灵活概念,并为泛化现有方法(例如DeepWalk,node2vec和许多利用随机游走的其他方法)奠定了基础。 我们提出的框架使这些方法可以更广泛地应用于转导和归纳学习,以及在具有属性的图上使用(如果可用)。 这是通过学习泛化到新节点和图的功能来实现的。 我们表明,我们提出的框架是有效的,平均AUC改善了16.55%,同时所需的空间比各种图形上的现有方法平均少853倍。 二阶随机游走采样方法取自的参考实现。 该模型现在也可在包中找到。
2022-05-14 17:39:27 4.35MB machine-learning research deep-learning tensorflow
1
眼网 机器学习算法框架(SVM + DNN)已在CompBio 2018的ICML-IJCAI研讨会上接受 EyeNet包含用于医学信息学和机器学习研究的机器学习模型和疾病标签 参考 如果您觉得这对您的工作有用,请考虑引用以下参考资料: @article{yang2018novel, title={A Novel Hybrid Machine Learning Model for Auto-Classification of Retinal Diseases}, author={Yang, C-H Huck and Huang, Jia-Hong and Liu, Fangyu and Chiu, Fang-Yi and Gao, Mengya and Lyu, Weifeng and Tegner, Jesper and others}, journal={arXiv
1
IJCAI-18 阿里妈妈搜索广告转化率预测 队名:进复赛就开源 成绩:round1 Rank 58/5204,round2 112/5204     文件说明 main.py: 主函数,包括特征提取与函数定义。 EDA_visual.py: 数据可视化分析文件 Bayes code: 贝叶斯平滑代码,这个可进行预处理保存为文件,可节省时间。 数据分析    主要包括数据分布分析,训练数据与测试数据的区别,以及对数据去重,填补空缺值等操作。通过对数据可视化处理,分析出特征与转化率之间的关系,有利于后续对特征的提取。 主要特征 点击次数\个数统计特征:    原始特征主要包括用户信息,广告商品信息,上下文信息以及店铺信息。根据经验,首先对重要特征统计次数以及两两之间互相组合,主要包括:用户与商品组合,商品与商店组合,用户与商店组合以及它们之间内部的组合。这里主要用到的工具是pandas中的g
2022-04-09 09:16:18 10.65MB Python
1
IJCAI2020的论文模板:LaTeX,word均有。每年模板变化不大,适用于想要投稿IJCAI的同学下载使用,直接用模板书写,省的写完了还得一个个的调格式。
2021-12-20 12:56:24 296KB 会议投稿
1
IJCAI-18 阿里妈妈搜索广告转化预测亚军解决方案 -1 赛题介绍 -2 数据下载 初赛数据链接:https://share.weiyun.com/56y91Fx 密码:89kry5 复赛数据链接:https://share.weiyun.com/5HRPNUU 密码:qrs04d -3 file文件中包含 特征重要性,特征群线下测试结果,比赛攻略,答辩ppt -4 代码讲解
2021-11-28 16:48:50 4.76MB Python
1