常规毒理学实验方法周期长、耗资高,对现代药物研发和环境化合物安全性评估具有局限性,通过对化合物毒理性研究,提取1 047维分子指纹特征,提出去噪自编码神经网络无监督学习机制及对腐败特征的自联想学习特性提取隐含毒性化合物特征,实现化合物毒性预测和毒性化合物的活性预测。该方法在化合物毒性预测和活性预测中的预测精度分别为79.825%、80.85%,敏感性分别为79.62%、80.25%,特异性分别为80.03%、81.45%。实验结果表明,去噪自编码网络较浅层机器学习更适用于高通量化合物毒性预测,较传统自编码网络更具优越性。
1
针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均衡原始数据集,考虑到合成样本过程中会产生噪声的影响,利用降噪自编码神经网络算法的逐层无监督降噪学习和有监督微调过程,有效实现对过采样数据集的降噪处理与数据分类。在UCI不平衡数据集上实验结果表明,相比传统SVM算法,该算法显著提高了不平衡数据集中少数类的分类精度。
2021-11-07 21:56:09 1.47MB 神经网络 过采样 不平衡数据 分类
1