RNA-Seq数据中circRNA的定量,差异表达分析和miRNA目标预测分析的工作流程。 介绍 nf-core / circrna是一种生物信息学流水线,用于定量,miRNA靶标预测和RNA测序数据中存在的circRNA的差异表达分析(当前支持总RNA-Seq配对末端测序数据,已映射至智人Gencode参考基因组GRCh37, GRCh38 v34)。 pipleline已以模块化方式开发,除了circRNA定量外,还允许用户选择miRNA靶标预测,差异表达分析(或两者),以促进围绕circRNA参与竞争内源RNA网络的假设。 该管道是使用构建的, 是一种工作流工具,可以以非常便携的方式跨多个计算基础架构运行任务。 它带有docker容器,使安装变得简单,结果可高度重现。 管道摘要 默认情况下, nf-core/circrna使用所有3个分析模块: circrna_discovery
2022-01-11 15:32:11 990KB workflow bioinformatics rna-seq pipeline
1
GTEx数据集(V8)的条件变量自动编码器 该项目旨在使用生成模型生成合成基因表达数据。 我们首先研究数据的3D表示形式以及可能要依据的变量,以便有效地分离分布。 当前模型以组织为条件。 组织着色的GTEx数据集(1000个随机基因)的3D表示形式(UMAP,TSNE,PCA): CVAE当前的重建质量,取决于组织。 基于: 对VAE方差损失论文: , , 项目进度: 基准模型创建 评估潜在空间中的均值,绝对差和分组的函数 模型调整 潜在空间大小 批次大小,学习率(应尽早确定时期数) 附加致密层的数量,每个附加层中神经元的数量 有条件的VAE模型(条件之一:组织或年龄) b-VAE模型(损失函数中的MSE / KL散度权重) 相关的VAE( ) torch_model.py神经网络的层和属性 gtex_loder.py加载基因表达数据集 torch_train
2022-01-10 10:05:56 1.65MB gene-expression pytorch gtex vae-implementation
1
Model-based Analysis of ChIP-Seq (MACS)
2021-12-30 12:10:05 292KB MACS
1
深度计数自动编码器可对scRNA-seq数据进行消噪 深度计数自动编码器网络使用具有零膨胀负二项式(ZINB)损失功能的深度自动编码器,通过考虑计数结构,数据的过度分散的性质和稀疏性来对scRNA-seq数据进行去噪并消除丢失的影响。 有关更多详细信息,请参见我们的和。 安装 点子 对于count自动编码器和所需软件包的传统Python安装,请使用 $ pip install dca conda 安装计数自动编码器和所需软件包的另一种方法是使用 (最容易通过)。然后运行以下命令。 $ conda install -c bioconda dca 用法 您可以从命令行运行自动编码器: dca matrix.csv results 其中matrix.csv是CSV / TSV格式的原始计数矩阵,其基因位于行中,单元格位于列中。细胞和基因标签是强制性的。 结果 输出文件夹包含主输出文件(代表Z
2021-12-27 21:51:57 6.49MB Python
1
TOBIAS-通过研究ATAC-seq信号预测转录因子的占有率 介绍 ATAC-seq(使用高通量测序进行转座酶可及性染色质测定)是用于研究全基因组染色质可及性的测序测定法。 该测定法应用Tn5转座酶将测序接头插入可利用的染色质中,从而能够绘制出基因组中调控区域的图谱。 另外,Tn5插入的局部分布还包含有关转录因子结合的信息,这是由于在被蛋白质结合的位点周围的插入处可见插入而导致的,这被称为“足迹” 。 TOBIAS是用于对ATAC-seq数据执行足迹分析的命令行生物信息学工具的集合,包括: Tn5插入偏差的校正 计算监管区域内的足迹得分 估计结合/未结合的转录因子结合位点 可视化不同条件之内和之间的足迹 有关每种工具的信息,请参见 。 安装 TOBIAS是作为python软件包编写的,可以通过pip快速安装: $ pip install tobias TOBIAS还可以通过Bio
2021-12-20 13:22:57 4.57MB bioinformatics atac-seq footprinting Python
1
单细胞RNA-Seq分析 这个为期2天的课程将讨论从scRNA-seq实验获得的数据的计算分析。 贡献 我们欢迎您为改进本课程而做出的所有贡献! 如果您在此过程中有任何疑问,疑虑或遇到任何困难,维护人员将竭尽所能为您提供帮助。 我们想请您熟悉我们的《 ,并查看有关正确格式,在本地呈现课程的方式,甚至如何编写新剧集的。 请参阅当前列表,以获取有关对此存储库做出贡献的想法。 为了做出您的贡献,我们使用GitHub流,这在一章中有很好的解释。 维护者 本课程的当前维护者是 作者 可以在“找到该课程的参与者列表 引文 要引用本课程,请向咨询
2021-12-13 20:19:11 1.58MB Python
1
层次分析matlab代码路径 scEpath软件包(用于分析单细胞RNA-seq数据的新型工具) 概述 这是scEpath(“单细胞能量路径”)的MATLAB软件包。 scEpath是一种新颖的计算方法,用于定量测量单细胞的发育能力和可塑性以及细胞状态之间的转移概率,并从单细胞基因表达数据推断谱系关系和伪时间顺序。 此外,scEpath还可以进行许多下游分析,包括针对给定的细胞簇或伪时间识别最重要的标记基因或转录因子。 scEpath推断细胞轨迹的合理性是基于著名的Waddington的景观隐喻来描述发育过程中的细胞动力学。 下面是一篇论文的概念图(Takahashi等人,开发,2015年) 查看详细的方法和应用程序。 以下是scEpath的概述。 系统要求 scEpath独立于操作系统,因为它是用Matlab编写的。 运行scEpath的基本要求包括MATLAB和统计工具箱。 伪时间估计步骤需要使用R包“ princurve”进行主曲线分析。 在这种情况下,运行scEpath时需要R和Matlab。 该软件包已在Mac OS / 64位Windows上使用MATLAB 2016a /
2021-12-11 16:29:24 8.59MB 系统开源
1
rnaSeqPipelineGLBRC.py 目的: Implementation of the Gasch lab RNA-Seq pipeline. 输入 : A text file with RNA-Seq fastq files to be processed. 请使用专用目录来运行管道。 创建您的目录并将您的 fastq 文件复制到该目录中。 通过移动到工作目录并运行 /bin/ls *.fastq > input.txt 来生成输入文件 所需参数: -f input.txt To run default enter: /home/GLBRCORG/mplace/scripts/rnaSeqPipelineGLBRC.py -f input.txt 可选参数: -r this will use "-s reverse" parameter for HTSeq
2021-12-07 11:00:23 11KB Python
1
转录组范围内对经典或替代性活化巨噬细胞的分析 概括 下一代测序(NGS)彻底改变了基于系统的细胞途径分析。 这项研究的目的是比较NGS衍生的人类M1和M2样巨噬细胞分析(RNA-seq)与微阵列和定量逆转录聚合酶链React(qRT-PCR)方法,并建立人类巨噬细胞的高分辨率转录组。 从经典和其他活化的人类巨噬细胞中分离总RNA.mRNA谱图是通过使用Illumina HiSeqSQ对3个供体的M1和M2巨噬细胞进行深度测序而生成的。 通过两种方法在转录亚型水平上分析了通过质量过滤器的序列读数:Casava1.8和TopHat,然后进行袖扣连接。 使用LightCycler和SYBR Green分析法进行qRT-PCR验证。 标题 geo_accession source_name_ch1 有机体_ch1 跑步 SRA_样本 cell_type 团体 M1_1 M1_1 G
2021-12-01 20:56:54 5.79MB HTML
1
** * THIS PACKAGE IS NO LONGER MAINTAINED ** * Scipy现在实现了Sobol序列生成器的实现,比该功能更完整。 您可以在此处查看文档: : Sobol序列在python中的实现 是准随机低差异序列,可用于创建样本分布。 安装 使用setuptools照常安装-可以从获得源代码。 或像这样的体面的包管理器: conda install -c https://conda.binstar.org/naught101 sobol_seq 您可以这样固定到Github的特定版本: pip install git+https://github.com/naught101/sobol_seq@v0.2.0#egg=sobol_seq 用法 使用i4_sobol生成单个Sobol向量: import sobol_seq vec, seed
2021-11-05 15:43:01 15KB Python
1