首先基于特征融合思想,采用氨基酸组成、熵密度和自相关系数结合的方式构建 190 维特征向量进行特.征表达,与仅考虑氨基酸组成信息的传统方法相比,能更好地表达蛋白质结构信息。然后利用 LDA(Linear .Discriminant Analysis)方法进行降维,降低计算复杂性,加强同类样本间的相关性。接下来选用支持向量机作为.分类器进行定位预测,最后采用留一法在 Gram-negative 和 Gram-positive 数据集上进行交叉检验。实验结果表明,.多特征结合的方法优于传统的氨基酸组成方法和简单的自相关系数方法,证明了新方法的有效性。
2024-03-23 08:48:32 414KB
1
荧光差异二维凝胶电泳技术在植物差异蛋白质组学中的应用,吕坤,郑彩霞,蛋白质组学是后基因组时代生物学研究的主要领域之一,由于研究生物体全部蛋白质组的困难大,可行性不高,因此研究蛋白质差异表达
2024-03-03 21:30:23 437KB 首发论文
1
中等强度运动大鼠左心室肌蛋白质组的差异性表达,雷雄,史绍蓉,目的:从蛋白质组学的角度探讨在中等强度有氧运动应激条件下,左室肌蛋白质组的差异表达及其规律,为研究有氧运动对心肌蛋白质
2024-03-01 19:13:59 453KB 首发论文
1
用于机器学习蛋白质结构的标准化数据集
2024-02-29 21:27:22 69KB Python开发-机器学习
1
基于泛素化途径的蛋白质降解策略,刘传扬,闵璐,蛋白质是生命活动的主要承担者。从基础研究的角度来看,干扰蛋白质的表达是研究蛋白质功能的有力策略之一。当前,CRISPR技术与RNAi�
2024-02-25 21:53:54 1010KB 首发论文
1
当前的工作集中在使用JAVA和开源资源进行“原始序列分析”的脱机工具的软件开发中。 SEQUENCIA工具是主要序列分析的离线工具,对于全世界的研究人员来说,这是一个相当普遍的话题。 序列名称,序列长度,吸光度,净电荷,等电荷,氨基酸组成,氨基酸分类,脂肪指数,不稳定性指数,平均亲水性等是此工具存在的与主要序列分析相关的属性。 这项工作包括在一个通用平台下与一级序列分析有关的所有理化特性。 JAVA,BIOJAVA用于平台无关体系结构。 该工具包括脱机属性,可以将结果存储为文本格式,此处我们可以粘贴多个序列,还可以上载FASTA文件以计算参数。
2024-01-19 10:51:41 3.89MB 开源软件
1
基于amber分子动力学: 蛋白质-蛋白质亲和力计算实作范例
2024-01-19 00:31:10 1.15MB
1
蛋白质定位位点的分析是生物信息学中的重要任务。在具有多个指标/特征的基于酵母蛋白质测量数据的众多研究方法中,预测酵母蛋白质定位位点是一个有前途的领域。为了反映这些特征对预测任务的不同贡献,提出了一种基于加权特征集合(WFE)的聚类算法,以基于收集的酵母蛋白质定位数据预测酵母蛋白质定位位点。 WFE过程首先为特征分配不同的权重,然后对结果进行计算和呈现以获得最佳结果。对基于WFE的算法和其他几种基于加权特征思想的聚类算法的实验结果表明,我们的新算法在准确性和稳定性方面均优于其他特征加权类型算法。
2024-01-15 16:41:23 957KB Clustering Algorithm; Yeast Protein
1
DeepAccNet.py 描述的 DeepAccNet 的 Python-PyTorch 实现 此方法将使用称为 l-DDT(局部距离差异测试)的度量来估计您的蛋白质模型的效果。 usage: DeepAccNet.py [-h] [--modelpath MODELPATH] [--pdb] [--csv] [--leaveTempFile] [--process PROCESS] [--featurize] [--reprocess] [--verbose] [--bert] [--ensemble] input ... Error predictor network positional arguments: input path to input fold
2023-11-07 16:22:14 933.72MB pytorch protein Python
1
matlab精度检验代码深醋酸 预测蛋白质中赖氨酸乙酰化位点的深度学习框架 要求 Python> = 3.6 Matlab2016a Tensorflow = 1.6.0 文件描述 “深度学习”文件夹中有七个子文件夹。 由这六个编码方案命名的文件夹是python代码,并且通过对通过不同编码方法获得的特征向量执行4倍交叉验证来获得预测变量。 在名为“编码方案”的文件夹中,MATLAB代码有六种不同的编码方案,分别为Aaindex,BLOSUM62,CKSAAP(K空间氨基酸对的组成),IG(信息增益)One-hot和PSSM(位置特定计分)矩阵)。 这些程序可以将蛋白质片段编码为不同尺寸的特征向量。 名为“蛋白质捕获”的文件夹是一种蛋白质拦截程序,能够将蛋白质解释为长度相等的以赖氨酸为中心的片段。 (注意:运行该程序时,将FASTA文件和蛋白质ID文件放在此文件夹中) 名为“功能组合”的文件夹包含通过将六种编码方法与F分数组合而获得的最佳模型。 (注意:在运行该程序时,将编码测试集放入文件夹中,并且该文件夹中的所有文件应位于同一路径中) 六种编码方式介绍 一键编码 在乙酰化位点附近的小范
2023-11-07 15:32:07 34.1MB 系统开源
1