数据集包含了920个标注过的录音,长度在10秒到90秒不等,录音来自126位病人。录音总时长为5.5小时,包含6898个呼吸周期:其中1864个有爆裂声(crackles),886个有喘息声(wheezes),506个二者皆有。数据包括背景干净的声音和为了模拟真实生活下嘈杂的录音。囊括了各个年龄段的病人:儿童、成年人和老人。
数据集的zip文件包含以下文件:
920个.wav格式的音频文件和相关的.txt格式的标注信息(audio_and_txt_files)
csv格式的病人诊断信息(patient_diagnosis)
解释文件命名格式的txt文件(filename_format)
罗列了91个名字的txt文件(filename_differences)
病人的人口信息(demographic_info)
1