预测AD调节性免疫细胞 预测AD SNP在免疫细胞类型中的调控活性。 在CMU的Pfenning Lab完成硕士论文工作。 由Andreas Pfenning,Easwaran Ramamurthy监督。 文件指南 cnn.py用于训练单标签和多标签分类模型 nullSet.R用于使用genNullSeqs生成GC匹配的负数。 用法:Rscript nullSet.R hg19 bed_file_name_without_the_extension signal_extraction.py包含用于生成一个热编码序列,添加反向补码,将Satpathy定义的簇分组为8个免疫细胞簇,将称为峰床文件转换为npy文件以进行模型训练和其他中间数据处理方法的代码。 tsv_extract.sh将Satpathy纸张中的原始片段文件转换为SCATE要求的bam文件格式。 联系信息 Snigdha Ag
2021-11-10 11:04:25 11KB Python
1
瓦吉诺 用于全基因组测序数据和大型SNP数据库的Fase SNP基因分型工具。 从Bioconda安装 可以使用命令conda install vargeno从Bioconda conda install vargeno 。 请转到以获取有关Bioconda的更多信息。 如果您尚未 ,则可以 。 快速使用 VarGeno作为输入: FASTA文件格式的参考基因组序列。 以VCF文件格式进行基因分型的SNP列表。 以FASTQ文件格式从供体基因组测序测序。 在对个体进行基因分型之前,必须使用以下命令为参考和SNP列表构建索引: vargeno index ref.fa snp.vc
2021-11-06 12:07:32 21.67MB bioinformatics snps algorithms computational-biology
1
SNPhylo 介绍 系统发育树是推断各种生物之间进化关系的良好工具,因此该树已在许多进化研究中使用。 因此,在重新测序项目中已经确定了基于SNP数据的系统树。 但是,没有简单的方法来确定具有大量从重测序数据中确定的变异体的系统发育树。 因此,我们开发了新的管道SNPhylo,以根据SNP数据构建系统发育树。 使用此管道,用户可以从包含大量SNP数据的文件中构建系统发育树。 特征 基于全基因组SNP的树木构建。 常规的树构建是基于大量具有某些特性的基因,例如单拷贝基因,核糖体RNA基因,内部转录间隔区序列(ITS)。 SNPhylo用全基因组信息构建树,因此更准确 通过连锁不平衡(LD)减少SNP冗余。 同一LD块中的SNP提供冗余的谱系信息。 SNPhylo在LD块中仅保留一个信息量丰富的SNP。 它极大地减少了运行时间,而不会丢失信息丰富的站点。 树的构建过程是高度自动化的。 SNP
2021-11-02 20:29:49 23.2MB Shell
1
vcf2phylip 将VCF格式的SNP转换为PHYLIP,NEXUS,二进制NEXUS或FASTA比对以进行系统发育分析 简要描述;简介 该脚本以VCF文件作为输入,并将使用SNP基因型创建PHYLIP(松弛版本),FASTA,NEXUS或二进制NEXUS格式的系统发育分析矩阵。 对于杂合SNP,已达成共识,并将IUPAC核苷酸歧义码写入最终矩阵(ces),允许任何倍性水平并自动检测。 该代码针对大型VCF矩阵(数百个样本和数百万个基因型)进行了优化,例如,在我们的测试中,它在约27分钟内处理了20GB VCF(约300万个SNP x 650个个体)。 该脚本的初始版本仅产生了PHYLIP矩阵,但现在我们添加了其他流行的格式,包括使用BEAST中的SNAPP插件运行SNP分析的二进制NEXUS文件(仅适用于二倍体基因型)。 此外,您可以为每个SNP选择最少数量的样本,以控制丢失数
2021-10-25 20:50:51 20KB snps binary nexus vcf
1
权力 R函数,用于在各种参数下计算单个关联SNP的GWAS研究的功效。 适用于使用线性回归模型的经典(即单SNP单性状)GWAS研究,即用于定量性状。 使用Visscher PM,Wray NR,Zhang Q等人的附录A中介绍的功率计算公式。 GWAS发现的10年:生物学,功能和翻译。 Am J Hum Genet 2017年; 101(1):5-22。 doi:10.1016 / j.ajhg.2017.06.005。 假设其他协变量(如果有)与SNP不相关。 通常将遗传PC作为协变量包含在GWAS中,以进行分层或混合调整。 在这种情况下,如果对SNP进行严格分层,则这些公式将不适用,并且基于模拟的方法可能更可取。 使用卡方统计量,等同于在回归中使用z统计量(卡方统计量是z统计量的平方)。 结果应该与使用基于t统计量的检验非常相似,因为对于大样本量,分布和正态分布之间的差异可以
2021-09-26 17:23:16 11KB R
1
s参数snp格式详解.pdf TouchStone格式文件也就是我们通常是到的SnP文件,用来表示S参数。它是用来保存N端口网络有源设备或者无源连接的参数。在TouchStone格式成为事实上的标准的同时,并没有正式的文档规定文件的格式和语法。本文基于安捷伦公司(Touchstone的来源)的信息,由EIA/IBIS组织制定成一个正式的规定。
2021-09-11 10:15:44 387KB s参数 ads 差分 单端
1
snp_tools 一套用于SNP分析的工具和附加组件 ## Introduction工具和附加组件,主要用于处理的输出, 是无对齐的SNP识别软件包。 ksnp_matrix_filter.pl和ksnp_matrix_to_diff_matrix.pl的基本功能将对任何以fasta格式对齐的序列起作用。 ## Requirements所有软件包都是用Perl编写的,并且需要bash shell。 以下先决条件必须在您的PATH中可用才能起作用。 全部必需: 重击 Perl 一些(ksnp_snp_confirm.pl,kmer_core.pl,kmer_compare.pl)必需: (> = v1.1.2)。 如果您有kSNP,则可能已经安装了该文件,并且已在您的路径中。 对于某些是可选的: gzip ##安装只需下载包含脚本的文件夹并将其放在可以找到它的位置。 重要说
2021-08-25 11:17:23 53KB Perl
1
利用高密度基因组芯片估计绵羊SNP之间的重组率和有效群体大小 ,张媛媛,邓学工,有效群体大小(Effective population size, Ne)是群体遗传学中的重要理论参数,同时被广泛地利用于遗传漂变和遗传变异速率的估计,是动物�
2021-08-11 20:01:01 965KB 首发论文
1
软件工具,读取解析网络分析仪S4p文件,不同品牌仪器、不同格式(MA、dB、RI)的S4p文件都能解析,直接点击导入S4p文件,就可得到最终得增益(dB)数据,数据包含:Sdd21(dB) Sdd12(dB) Sdd11(dB) Sdd22(dB) S11(dB) S12(dB) S13(dB) S14(dB) S21(dB) S22(dB) S23(dB) S24(dB) S31(dB) S32(dB) S33(dB) S34(dB) S41(dB) S42(dB) S43(dB) S44(dB) 自动保存Excel,方便查看数据频率点对应得各个数据
2021-08-04 18:06:07 4.68MB 网络分析仪 Snp文件 S4p 实部虚部
1