PD数据库由训练和测试文件组成。培训数据属于20名PWP(6名女性,14名男性)和20名健康人(10名女性,10名男性),他们在伊斯坦布尔大学Cerrahpasa医学院神经系上诉。从所有主题,采取多种类型的录音(26个声音样本,包括持续元音,数字,单词和短句)。从每个语音样本中提取一组26个线性和时间 - 基于频率的特征。由该专家医师确定的每个患者的UPDRS((统一帕金森氏病评分量表)分数也可用于该数据集)因此,该数据集也可用于回归。
在收集由多种类型的录音组成的训练数据集并进行实验后,根据所获得的结果,我们继续在相同条件下通过同一医生的检查过程收集来自PWP的独立测试集。在收集这个数据集的过程中,28名PD患者被要求分别只说出持续元音'a'和'o'三次,共计168次录音。从该数据集的语音样本中提取相同的26个特征。这个数据集可以作为一个独立的测试集来验证在训练集上获得的结果。
2019-12-21 21:42:56
20.29MB
数据库
1