BDC2019-rank24th:中国高校计算机大赛-大数据挑战赛,Rank24解决方案-源码

上传者: 42120275 | 上传时间: 2022-02-13 11:03:48 | 文件大小: 199KB | 文件类型: -
BDC2019-排名24 中国高校计算机大赛-大数据挑战赛,Rank24解决方案 赛题描述: 我对业务的简单理解:就是就是搜索引擎,你搜一个“我是蔡”,即一个查询对应可能的搜索结果(即标题):①我是蔡虚鲲②我是菜徐坤③我是会员的接班人这时候你很可能就会去点我是蔡徐坤这就是这个比赛的任务,给你一个query-title对,让你预测这个query-title对被点击的概率,即可看做一个二分类问题,标签为0或1。 方案细节: lgb两千万数据分数abang 0.590 nn替换纯文本输入,6个nn进行stacking之后分数a榜接近0.58。 nn stacking + lgb a榜605 b榜618。 方案耗时: 6个nn训练时间:共计24小时。特征生成时间(在1亿数据上):普通特征1小时,w2v距离特征8小时,tsvd特征1小时。共计10小时。 赛题解决方案: 通过分析可知, ①que

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明