Spotify项目
概括
对于我的顶点项目,我选择解决基于歌曲属性为歌曲分配流派的问题。在这种情况下,Spotify正在考虑发布音乐,类似于SoundCloud允许用户发布内容的方式。在准备向平台添加音乐的用户时, Spotify要求一种将这些新歌曲分类到各自流派中的方法。我选择使用PyTorch构建一个多类分类模型来创建一个神经网络。来自kaggle的数据由于在目标值类型方面不平衡而受到限制。鉴于这种缺陷,我能够将基准精度提高十倍。该存储库包含与此项目有关的所有材料。
目录
文档名称
类型
描述
代码/Data_EDA.ipynb
木星笔记本
该笔记本包含Spotify数据上执行的数据清理和EDA。
代码/modeling.ipynb
木星笔记本
该笔记本包含“建模”过程,该过程可根据有关歌曲的数据查找歌曲流派。
数据
文件夹
此文件夹包含来自kaggle的原始数据和用于建模的已清理数据
1