天池大数据穿衣搭配算法比赛.zip
2023-10-19 16:27:17 383KB
1
TinachiBigData 阿里巴巴天池大数据竞赛
2022-06-05 16:19:39 47KB Python
1
tianchi_bigdata 任务: 特征(39维): user特征、item特征、user-item特征、全局比例特征 数据采样 采用移动窗口target(17、15、13、11、9)+移动窗口样本采样(1、3、7、全部) 训练数据 正样本:15000,负样本:130000 测试数据 同样采用移动窗口变换采样,取了3天、5天、9天的做实验,最优提交为9天的,测试样本大小:155万 结果划分 结果最终取置信度0.78,取470条结果(子集结果),最终f1值:11.46% 排名:25/7200,队伍名:叮当 学习模型 RF 程序架构 combine_feature_txt:混合正负样本特征 cut_data_set.py:按照移动窗口方式,分割数据集 fetch_feature.py:提取特征 fetch_negative_sample:负样本抽样 fetch_sample:提取正、负样本
2022-04-30 10:13:34 8KB Python
1
天池贵州交通代码,第一赛季rank53,第二赛季rank13 题目说明:根据历史路段每小时每2分钟统计平均通行时间预测为了一小时每2分钟同行时间。 模型思路:  规则:统计历史路段对应时刻的通行时间作为未来1小时需要预测的目标  模型:寻找尽可能多的相似时刻的记录预测未来1小时的目标  复赛:将要预测的时段进行分类,针对类别分别建立模型 需要改进: 数据的选择和清洗 未利用上下游关系  3. 数据集:链接: 密码:g8ov 2018年1月8日
2021-12-29 18:20:47 40KB Python
1
FashionAI认可 天池大数据竞赛:FashionAI全球挑战赛-服饰属性标签识别竞赛源代码
2021-12-17 11:59:58 5KB 系统开源
1
#天池大数据淘宝穿衣搭配算法
2021-12-08 21:12:52 109KB Python
1
天池_大数据 阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码(2017/09/18)
2021-10-04 10:41:44 5.42MB 系统开源
1
对数据进行预处理,生成更多的训练样本。基于以上构建的训练集,训练了多个回归模型,包括:XGboost、GBDT、RandomForest、SVR(线性核与高斯核),训练时各个分仓是分别建模的。
1
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
2021-06-25 19:33:07 6.44MB 数据分析 天池大数据
1
“万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案 wodejiafeiyu|nano- nano- 康一帅 简介 环境 Tensorflow == 1.14.0 Keras == 2.3.1 bert4keras == 0.8.8 文件说明 EDA:用于探索性数据分析。 code/train.py:用于模型的训练。 code/infer.py:用于模型的推断(预测)。 code/utils.py:工具函数。 data:数据目录。 赛题背景分析及理解 赛题是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq
2021-06-24 20:03:44 10.89MB JupyterNotebook
1