音频流派分类 使用机器学习算法自动进行音乐流派分类,例如逻辑回归和 K-最近邻 使用语言: Python 2.7 此存储库包含根据以下流派对音乐进行分类的开发代码: 蓝调 古典(西方) 国家 迪斯科 金属 流行音乐 数据集 用于训练模型的数据集是 GTZAN 数据集。数据集简介: 该数据集用于 G. Tzanetakis 和 P. Cook 在 2002 年 IEEE Transactions on Audio and Speech Processing 中的流派分类“音频信号的音乐流派分类”中的著名论文。 该数据集由每 30 秒长的 1000 个音轨组成。它包含 10 个流派,每个流派由 100 首曲目表示。曲目均为 .wav 格式的 22050Hz 单声道 16 位音频文件。 官方网页:marsyas.info 下载大小:约1.2GB 下载链接:下载 GTZAN 流派合集
2022-12-09 00:03:50 9KB python
genreXpose, 基于机器学习的音乐流派分类 #genreXpose v0.1文档程序允许快速和自动检测音频/音乐文件类型。这里项目未处于积极开发状态。===================== =本文简要介绍了如何在你的项目中使用这个库。关于构建这里库所使用的底层技术的更
2022-07-12 15:05:51 1.32MB 开源
1
音乐流派分类 使用1D和2D卷积神经网络比较使用频谱图输入和原始音频输入的音乐流派分类。 在此实验中,仅使用每个音频的前20秒。 每个音频样本被分为2秒音频的10个部分。 先决条件 - Python 2 - Numpy - Matplotlib - Scikit-learn - Scikit-plot - Keras - Tensorflow - Kapre - Librosa - ffmpeg 数据集 乔治·扎纳塔基斯(George Tzanetakis)设定的音乐流派数据。 数据集包含1000个音轨,每个音轨长30秒。 它包含10个流派,每个流派由100首曲目代表。 结果(10个纪元) 混淆矩阵 ROC曲线 测试精度 带一维CNN的原始音频输入 0.31 一维CNN的频谱图输入 0.7372 二维CNN的频谱图输入 0.686 参考: Dieleman,Sander和B
2022-03-23 15:04:32 682KB JupyterNotebook
1
音乐流派分类 关于该项目 该项目旨在使用多种模型基于音频样本和不同的可视化技术对音乐流派进行分类,以理解数据。 该项目的灵感来自上的代码,该代码实现了K-Nearest Neighbor方法来解决此问题。 这是该项目的起点。 数据集: : 笔记本电脑 从音频样本中提取梅尔频率倒谱系数(MFCC)。 包括K-最近邻方法对流派进行分类(来自 )。 比较了具有不同K值的模型的准确性。 使用颜色图可视化的梅尔频率倒谱系数,以更好地理解数据并获得关于MFCC的更直观的视角。 比较了不同类型的MFCC。 将MFCC均值和协方差矩阵特征转换为Pandas数据帧。 训练了逻辑回归模型以使用这些功能对音乐流派进行分类。 调整模型以通过增加正则化强度和随机化数据来防止过度拟合。 探索了使用PCA减少功能部件数量的影响。 使用Librosa从音频样本中提取梅尔频谱图。 这种非结构化数据对于卷积神经网
2022-01-11 15:49:56 4.33MB JupyterNotebook
1
音乐流派分类 我的目标是在使用音乐数据集训练我的机器学习模型(KNN,随机森林,决策树,朴素贝叶斯)之前,提取音乐数据集(使用GTZAN)的每个.wav文件的声学特征(使用librosa库)。 -learn),并对用户选择的其他音乐文件的类型进行分类。 有10种音乐流派(摇滚,爵士,古典等)。 该项目尚未完全完成。 1)特征提取✓ 2)训练模型- 3)对音乐文件进行分类- 4)创建用户界面-
2021-05-11 17:07:59 2KB
1
该部分为总数据集,该部分为总数据集,该部分为总数据集,该部分为总数据集。
2020-01-03 11:31:59 48.47MB 音乐流派分类 数据集
1