DCASE实用程序 声音场景和事件的检测和分类的实用程序的集合 该实用程序集合用于声音场景和事件的检测和分类(DCASE)。 这些实用程序最初是为DCASE挑战基准系统( 和)创建的,并捆绑到一个独立的库中,以便在其他研究项目中重复使用。 该实用程序的主要目标是简化研究代码,使其更具可读性,并且更易于维护。 大多数已实现的实用程序都与音频数据集有关:处理元数据和各种形式的其他结构化数据,并为来自各种来源的音频数据集提供标准化的用法API。 文献资料 有关详细说明,手册和教程,请参见 。 安装说明 PyPI上提供了最新的稳定版本,您可以使用pip进行安装: pip install dcase_util 执照 在下发布的代码。
2022-05-23 21:24:04 31.39MB dcase Python
1
任务4:智能汽车的大型弱监督声音事件检测 协调员 本杰明·埃里扎德(Benjamin Elizalde),伊曼纽尔·文森特(Emmanuel Vincent),比克莎·拉吉(Bhiksha Raj) 数据准备,注释 Ankit Shah( ),Benjamin Elizalde( ) 注释,基线和子任务的度量 Rohan Badlani( ),Benjamin Elizalde( ),Ankit Shah( ) 指数 直接下载开发和评估套件的音频 用于下载任务4的开发数据的脚本 评估任务4的脚本-子任务A(音频标记)和子任务B Strong Label的测试注释 1.直接下载用于开发和评估集的音频 评估集的注释尚未发布。 可以通过向Ankit Shah( )或Benjamin Elizalde( )发送请求电子邮件来共享密码。 (Psswd培训文件:DCASE_2017_
2021-11-11 11:04:54 2.39MB machine-learning acoustics dcase dcase2017
1
DCASE 2019-任务5-城市声音标记 该存储库包含我用于的最终解决方案。 该模型在粗略和精细级别标签的预测中均排名第一。 再现结果 先决条件: 基于Linux的系统 Python> = 3.5 拥有至少8GB内存的NVidia GFX卡 CUDA> = 10.0 已安装virtualenv软件包 复制: 克隆此存储库。 要使用单个命令复制整个解决方案,请在存储库目录中时执行make run_all命令。 该命令按顺序执行以下步骤: make env :在当前目录中创建虚拟环境 make reqs :安装python软件包 make pytorch :安装PyTorch make download :从Zenodo下载Task 5的数据 make extract :提取压缩文件 make parse :解析注释 make logmel :计算并保存所有文件的Log-Mel频
1
DCASE 2020-任务3-4月 这是我们对DCASE2020任务3挑战的贡献。 (C)2020年AndrésPérez-López和RafaelIbañez-Usach。 如[1]中所述,该存储库保留了参数粒子过滤器(PAPAFIL)方法的实现。 该方法如何工作? PAPAFIL基于四个主要构建块: 估计单源TF仓并计算其瞬时窄带DOA。 使用粒子跟踪系统将DOA转换为一致的事件轨迹和激活。 使用这些注释在空间和时间上对B格式输入信号进行过滤,从而产生单音事件估计。 使用基于GBM的单分类器将分类标签分配给每个事件估计。 下图描述了该体系结构,其中Omega和Ypsilon
2021-03-16 16:49:35 235.32MB localization detection classification seld
1