TianChiCompetition
Our responding code and resources for TianChi competition
#Update 2015/04/10
基本框架的构建:
特征工程部分
Generate_raw_train.py (从原始数据中按照分割点,得到分割点前的数据)
Generate_feature_All.py (从raw_train数据中提取特征,并构建基于特征向量的训练集合)
算法框架部分
Algorithm_LRTest.py (利用LR回归,进行分类预测)
Function_CalF1.py (F1函数的计算)
负样本影响问题
测试产生 '候选集'的过程中,发现虽然只用子集,但是一早上起来,数据量还是把硬盘给爆了,经测试,代码应该没有产生大问题。估计是负样本太多,过多的想预测没有发生过预测行为的(U,I)对。尝试取消这部分内容
#U
2022-07-25 20:07:30
40.25MB
Python
1