The Million Song Dataset is a joint effort between the Computer Audition Lab at UC San Diego and LabROSA at Columbia University. The user data for the challenge, like much of the data in the Million Song Dataset, was generously donated by The Echo Nest, with additional data contributed by SecondHandSongs, musiXmatch, and Last.fm. The Million Song Dataset aims at being the best possible offline evaluation of a music recommendation system. “百万歌曲数据集”是加州大学圣地亚哥分校计算机视听实验室和哥伦比亚大学拉布罗萨实验室共同努力的成果。该挑战的用户数据,就像Million Song数据集中的大部分数据一样,都是由Echo Nest慷慨捐赠的,另外还有SecondHandSongs、musiXmatch和Last.fm提供的数据。百万歌曲数据集的目标是成为最好的离线音乐推荐系统评估。 MSDChallengeGettingstarted.pdf kaggle_users.txt kaggle_songs.txt taste_profile_song_to_tracks.txt kaggle_visible_evaluation_triplets.txt
音乐入耳:具有百万首歌曲数据集的推荐系统 陈晓怡,陈志然,丁开成,刘卫新,王学宁,易瑞涛 卡尼基·梅隆大学 介绍 我们提出并实现了一种机器学习管道,该管道将针对大型个性化歌曲推荐系统的基于内容的推荐方法和协作推荐方法相结合。 目标是在给定用户的收听历史和所有歌曲的完整信息(包括元数据和音频特征分析)的情况下,预测用户将收听的歌曲并向每个用户推荐10首歌曲的推荐列表。 依存关系 Python 3.6 表3.6.1 h5df 0.1.5 脾气暴躁的1.18 Scikit-学习0.23.2 熊猫0.15.2 Matplotlib 3.3.1 希伯恩0.10.1 Spark_notebook_helpers 1.0.1 档案文件 . ├── utils ├── 10605_Project_Report.pdf ├── README.md ├── collaborative_bad_
