用户兴趣建模大赛top10开源代码
下面分别列出了这三部分对应的代码文件,依次每个代码文件的功能,输入,输出进行了详细说明。
1.预处理
merge_smallfiles.py
功能:将视觉特征的小文件合并;输入:视觉特征,存放于单独的小文件中;输出:train0.pkl,train1.pkl,test.pkl说明:由于内存限制,将训练集的视觉特征存放在两个文件中;
random_sample.py
功能:分别在训练集和测试集视觉特征中采样10%,用于视觉特征聚类;输入:train0.pkl,train1.pkl,test.pkl输出:train0_sample0.1.pkl,train1_sample0.1.pkl,test_sample0.1.pkl
2. feature_engineering
kmeans.py
功能:在10%的视觉特征上训练kmeans聚类算法,变为所有视觉特征进
2021-11-03 19:50:48
10.76MB
系统开源
1