新型荧光蛋白的从头合成及性质鉴定,孙婷婷,易科,迄今,获得荧光突变体通常采用两种方法—随机突变和定点诱变。对于随机突变,我们不能够对突变点进行预测同时我们也不能获得具有
2024-03-22 06:47:12 705KB 首发论文
1
琥珀酰化是蛋白质翻译后修饰(PTM)的一种广泛类型,在调节蛋白质构象,功能和理化性质方面起着重要作用。 与劳动密集和费时的实验方法相比,琥珀酰化位点的计算预测由于其方便快捷的速度而非常可取。 当前,已经开发了许多计算模型以通过各种类型的两类机器学习算法来识别PTM站点。 这些方法需要正样本和负样本进行训练。 但是,很难指定PTM的负样本,如果不能正确完成,会极大地影响计算模型的性能。 因此,在这项工作中,我们将正样本仅学习(PSoL)算法首次应用于琥珀酰化位点预测问题,这是一类特殊的半监督机器学习,它使用正样本和未标记样本来训练模型。 同时,我们通过使用多种特征编码方案,提出了一种新颖的琥珀酰位点计算预测子,称为SucPred(琥珀酰位点预测子)。 通过使用SucPred预测变量,在训练数据集上进行5倍交叉验证并在独立测试数据集上进行了5倍交叉验证,其准确性为88.65%,这表明此处介绍的仅用于学习算法的阳性样本特别有用用于鉴定蛋白质琥珀酰化位点。 此外,仅用于正样本的学习算法可以轻松地为其他类型的PTM网站建立预测器。 开发了用于预测琥珀酰化位点的Web服务器,该服务器可从http:
2022-03-29 21:37:59 514KB Succinylated proteins; Positive samples
1
蛋白质网 ProteinNet是用于机器学习蛋白质结构的标准化数据集。 它提供蛋白质序列,结构(和),多个序列比对( ),位置特定的评分矩阵( ),以及标准化的拆分。 ProteinNet建立在两年期评估的基础上,该评估对最近解决但尚未公开获得的蛋白质结构进行盲目预测,以提供推动计算方法学前沿的测试集。 它被组织为一系列数据集,涵盖了CASP 7至12(涵盖十年),以提供一系列数据集大小,从而可以在相对数据贫乏和数据丰富的体制中评估新方法。 请注意,这是一个初步版本。 用于构建数据集的原始数据以及MSA尚未普遍可用。 但是,可应要求提供ProteinNet 12的原始MSA数据(4TB)
1
PyPDB 使用RCSB蛋白质数据库(PDB)执行搜索的Python 3工具箱。 这可用于对符合各种条件的PDB ID执行高级搜索,以及查找与特定PDB ID相关的信息。 该工具允许在Python脚本中执行可以在PDB网站中执行的标准操作(BLAST,PFAM查找等)。 每个函数及其相关输出的示例可以在找到。 如果您将此模块用于任何已发表的作品,请考虑引用随附的论文 Gilpin, W. "PyPDB: A Python API for the Protein Data Bank." Bioinformatics, Oxford Journals, 2015. 截至2020年11月,为了适应RCSB PDB API的更改并扩展功能,pypdb正在进行大量重构。 对于此过程中发生的任何重大变化,我们深表歉意。 pypdb的先前版本可; 但是,它将不再对更改的RCSB API起
2021-11-09 11:35:45 49KB proteins pdb protein-data-bank protein-structure
1
使用Amazon SageMaker微调和部署ProtBert模型进行蛋白质分类 内容 动机 蛋白质是控制生物体的关键基本大分子。 蛋白质定位的研究对于理解蛋白质的功能很重要,对药物设计和其他应用具有重要意义。 它在表征假设的和新发现的蛋白质的细胞功能中也起着重要的作用[1]。 有几项研究工作旨在通过使用高通量方法来定位整个蛋白质组[2-4]。 这些大型数据集提供了有关蛋白质功能以及更普遍的全球细胞过程的重要信息。 但是,它们目前不能达到100%的蛋白质组覆盖率,并且在某些情况下使用的方法可能导致蛋白质子集的错误定位[5,6]。 因此,必须有补充方法来解决这些问题。 在本笔记本中,我们将利用自然语言处理(NLP)技术进行蛋白质序列分类。 想法是将蛋白质序列解释为句子,并将其组成部分-氨基酸-解释为单个单词[7]。 更具体地说,我们将从Hugging Face库中微调Pytorch Pro
1
A feasible method of combining the concept of fluorescence half-life and the power dependent photobleaching rate for characterizing the practical photostability of fluorescent proteins (FPs) was introduced. Furthermore, by using a fluorescent photostability standard, a relative comparison of the pho
2021-02-10 16:05:31 294KB 荧光蛋白 160.2540 180.2520 300.6390
1
关于蛋白质的研究,对蛋白质的分类的认识和预测。
2019-12-21 22:25:06 134KB interaction map yeast proteins
1