上传者: 42126274
|
上传时间: 2021-12-11 21:15:37
|
文件大小: 31.29MB
|
文件类型: -
新浪微博互动预测
介绍
比赛的详细信息可以在找到竞争主要是分析用户在中国微博平台上发布的行为和消息,并预测每条消息的转发,评论和喜欢的次数。
该项目主要使用python和pandas。
这项比赛的第二阶段仍在进行中。 这是我为第1阶段构建的数据基准线。
设计
这是一个自行设计的数据基准线。 主要思想是模块化数据项目的流程。
用户编写方法来生成功能,其存储数据帧中大熊猫在功能的文件夹,并feature.log会自动记录所有现有的功能和它们的参数。
用户可以在Train方法中组合不同的功能并选择不同的模型,模型将存储在models文件夹中,模型的信息将存储在train.log中。
用户选择不同的功能和参数组合进行测试,结果将存储在结果文件夹中,而测试信息将存储在test.log中
笔记本文件夹中的Ipython笔记本用于播放数据,迭代地查看日志。
该代码位于weiboPredict