琥珀酰化是蛋白质翻译后修饰(PTM)的一种广泛类型,在调节蛋白质构象,功能和理化性质方面起着重要作用。 与劳动密集和费时的实验方法相比,琥珀酰化位点的计算预测由于其方便快捷的速度而非常可取。 当前,已经开发了许多计算模型以通过各种类型的两类机器学习算法来识别PTM站点。 这些方法需要正样本和负样本进行训练。 但是,很难指定PTM的负样本,如果不能正确完成,会极大地影响计算模型的性能。 因此,在这项工作中,我们将正样本仅学习(PSoL)算法首次应用于琥珀酰化位点预测问题,这是一类特殊的半监督机器学习,它使用正样本和未标记样本来训练模型。 同时,我们通过使用多种特征编码方案,提出了一种新颖的琥珀酰位点计算预测子,称为SucPred(琥珀酰位点预测子)。 通过使用SucPred预测变量,在训练数据集上进行5倍交叉验证并在独立测试数据集上进行了5倍交叉验证,其准确性为88.65%,这表明此处介绍的仅用于学习算法的阳性样本特别有用用于鉴定蛋白质琥珀酰化位点。 此外,仅用于正样本的学习算法可以轻松地为其他类型的PTM网站建立预测器。 开发了用于预测琥珀酰化位点的Web服务器,该服务器可从http:
2022-03-29 21:37:59 514KB Succinylated proteins; Positive samples
1