tianchi_bigdata:阿里2015年天池大数据比赛,采用移动窗口采样加随机森林学习

上传者: 42146274 | 上传时间: 2022-04-30 10:13:34 | 文件大小: 8KB | 文件类型: ZIP
tianchi_bigdata 任务: 特征(39维): user特征、item特征、user-item特征、全局比例特征 数据采样 采用移动窗口target(17、15、13、11、9)+移动窗口样本采样(1、3、7、全部) 训练数据 正样本:15000,负样本:130000 测试数据 同样采用移动窗口变换采样,取了3天、5天、9天的做实验,最优提交为9天的,测试样本大小:155万 结果划分 结果最终取置信度0.78,取470条结果(子集结果),最终f1值:11.46% 排名:25/7200,队伍名:叮当 学习模型 RF 程序架构 combine_feature_txt:混合正负样本特征 cut_data_set.py:按照移动窗口方式,分割数据集 fetch_feature.py:提取特征 fetch_negative_sample:负样本抽样 fetch_sample:提取正、负样本

文件下载

资源详情

[{"title":"( 11 个子文件 8KB ) tianchi_bigdata:阿里2015年天池大数据比赛,采用移动窗口采样加随机森林学习","children":[{"title":"tianchi_bigdata-master","children":[{"title":"fetch_negative_sample.py <span style='color:#111;'> 284B </span>","children":null,"spread":false},{"title":"get_feature_vector_txt_4.py <span style='color:#111;'> 1.56KB </span>","children":null,"spread":false},{"title":"global_feature.py <span style='color:#111;'> 898B </span>","children":null,"spread":false},{"title":"cut_data_set.py <span style='color:#111;'> 1.23KB </span>","children":null,"spread":false},{"title":"fetch_feature.py <span style='color:#111;'> 12.91KB </span>","children":null,"spread":false},{"title":"classify_user_item.py <span style='color:#111;'> 876B </span>","children":null,"spread":false},{"title":"get_recommend_result_6.py <span style='color:#111;'> 1.40KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 1.36KB </span>","children":null,"spread":false},{"title":"combine_feature_txt.py <span style='color:#111;'> 305B </span>","children":null,"spread":false},{"title":"fetch_sample.py <span style='color:#111;'> 543B </span>","children":null,"spread":false},{"title":"produt_test_data.py <span style='color:#111;'> 468B </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明