lyrics_scraper:建立你自己的歌词语料库-源码

上传者: 42140846 | 上传时间: 2022-03-07 14:26:18 | 文件大小: 6KB | 文件类型: -
目的 这是一个帮助获取歌曲元数据和歌词的工具。 它有两个方面: 获取用户选择的流派和时间段的广告牌播放列表中的热门歌曲 根据来自的标题和艺术家信息获取歌曲的歌词。 用法 create_corpus.sh将这两个功能结合在一起,将歌词语料库构建到您的本地文件系统中。 它具有一些不同的参数: 您想要从中获取歌曲的广告牌图表。 这个图表信息可以通过浏览找到感兴趣的图表,通过查看 URL 的后缀,例如 URL 中的后缀 'rb-hip-hip-songs' 。 您要从给定 Billboard 的每一年下载的歌曲数量 您要从中获取歌曲的年份。 这被烘焙到 for 循环seq 2000 2015 ,这意味着从 2000 年到 2015 年,下载rb-hip-hop-songs的前 300 首rb-hip-hop-songs 。 运行: ./create_corpus.sh 依赖关系 为了提高

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明