上传者: 42140846
|
上传时间: 2022-03-07 14:26:18
|
文件大小: 6KB
|
文件类型: -
目的
这是一个帮助获取歌曲元数据和歌词的工具。 它有两个方面:
获取用户选择的流派和时间段的广告牌播放列表中的热门歌曲
根据来自的标题和艺术家信息获取歌曲的歌词。
用法
create_corpus.sh将这两个功能结合在一起,将歌词语料库构建到您的本地文件系统中。 它具有一些不同的参数:
您想要从中获取歌曲的广告牌图表。 这个图表信息可以通过浏览找到感兴趣的图表,通过查看 URL 的后缀,例如 URL 中的后缀 'rb-hip-hip-songs' 。
您要从给定 Billboard 的每一年下载的歌曲数量
您要从中获取歌曲的年份。 这被烘焙到 for 循环seq 2000 2015 ,这意味着从 2000 年到 2015 年,下载rb-hip-hop-songs的前 300 首rb-hip-hop-songs 。
运行: ./create_corpus.sh
依赖关系
为了提高