银杏的寿命很长,其生长相对较慢。 但是,对该物种中与生长相关的基因知之甚少。 我们通过在转录组水平上开发多态性分子标记,将mRNA测序(RNA-Seq)与大量分离子分析(BSA)结合起来,精细绘制重要的农艺性状基因。 在这项研究中,对银杏半同胞家族的高生长(GD)和低生长(BD)样品进行了转录组测序。 组装干净的读段后,检测到601个差异表达基因,其中513个被分配了功能注释。 单核苷酸多态性(SNP)分析鉴定出与GD和BD组中的119个基因相关的SNP; 这些基因中有58个带有注释。 与BD组相比,GD组中两个Homeobox-亮氨酸拉链蛋白基因上调。 因此,这些很可能与银杏的高生长有关。 这项研究提供了分子水平的数据,可用于未来生长计划的高生长银杏半同胞族种子选择。
2024-01-14 20:04:05 3.97MB 转录组测序
1
蚕豆(Vicia faba L)种子是人类和动物重要的植物蛋白来源。 在蚕豆种子的RNA-Seq中发现了总共15,697个具有途径注释的差异表达基因(DEG)。 总共发现了75条重要的KEGG途径丰度,并且在所有基因型中保守了9条途径。 在2至6对基因型的比较中,发现41条重要途径被部分保留,而25对重要途径是单对基因型所独有的。 发现了与蚕豆种子水合能力性状相关的8条特定的重要途径,以及与PSbMV种子染色性状相关的9条特定的重要途径。 DEGs通过育种谱系选择信息证实了这些品种之间的遗传距离,并且PCA图清楚地说明了这些基因型内的遗传距离。
2024-01-14 17:26:19 6.21MB 行业研究
1
芯片序列分析 Snakemake管道 我开发了一个基于Snakemake的ChIP-seq管道: 。 和ATACseq管道: ChIP-seq的资源 : :来自ENCODE的元数据的汇编。 一个bioc包,用于访问ENCODE的元数据并下载原始文件。 论文: 。 序列为.sra格式,需要使用sratools转储到fastq中。 。 序列以fastq格式提供。 用于核小体定位和TF ChIP-seq的工具和论文的集合 评论文章:解密ENCODE EpiFactors是一个表观遗传因子,相应的基因和产物的数据库。 生物明星手册。 我的ChIP-seq章节将于2017年4月发布! ReMap 2018对法规区域的综合ChIP-seq分析。 ReMap地图集包含来自公共数据集的485个转录因子(TF),转录共激活因子(TCA)和染色质重塑因子(CRF)的8000万个峰。 可以浏览或
1
BSpipe是从序列质量控制和映射到差异甲基化区域功能分析的综合管道:(1)测序质量评估,(2)序列清洗,(3)序列读取映射,(4)甲基化定量,(4)样品比较基于甲基化分布图,(5)识别DMR(差异甲基化区域),(6)DMR注释,(7)差异甲基化基因的功能分析,(8)生成用于可视化的输入文件,以及(9)支持先进的测序技术,例如TAB-seq,OxBS-seq,MAP-it和NOMe-seq。
2023-09-11 17:49:55 3.92MB 开源软件
1
k-means聚类算法及matlab代码安全聚类 SAFE(来自Ensemble的单细胞聚合聚类):单细胞RNA-seq数据的聚类集成 尽管最近已经开发出几种方法来使用单细胞RNA-seq(scRNA-Seq)数据对细胞类型进行聚类,但它们利用了数据的不同特征,并且在聚类数量和实际聚类分配方面均产生了不同的结果。 在这里,我们介绍了SAFE聚类,单细胞聚合(来自Ensemble)聚类,这是一种灵活,准确且可靠的聚类scRNA-Seq数据的方法。 SAFE聚类将多种聚类方法的结果作为输入,以构建一个共识解决方案。 SAFE聚类目前嵌入了四种最先进的方法,即SC3,CIDR,Seurat和t-SNE + k -means。 并使用三种基于超图的分区算法将这四种方法的解决方案整合在一起。 SAFE聚类由Yuchen Yang []和Yun Yun []维护。 新闻与更新 2020年9月7日 2.00版已发布 SAFEclustering中使用的Seuart版本已更新为版本3。Seuratv.2不再兼容 SAFE聚类仅接受计数数据。 其他格式,例如FPKM,CPM和RPKM不再兼容 2018年
2023-04-18 14:15:42 4.17MB 系统开源
1
康诺斯 Conos:在样本网络上聚类 什么是conos? Conos是一个R包,用于将大量单细胞RNA-seq数据集组合在一起,从而既可以识别复发性细胞簇,又可以在多样本或Atlas规模集合中的数据集之间传播信息。 它着重于跨异构样本集合的同源细胞类型的均匀映射。 例如,用户可以研究来自癌症患者的数十种外周血样本的收集以及数十种对照,其中可能包括相关组织(如淋巴结)的样本。 它是如何工作的? Conos应用了许多容易出错的方法中的一种来对齐集合中的每对样本,从而建立了加权的样本间单元间链接。 然后可以分析所得的联合图,以识别不同样品之间的亚群。 相同类型的单元格将倾向于在许多此类成对比较中相互映射,从而形成可以识别为簇(图社区)的集团。 Conos处理可以分为三个阶段: 阶段1:过滤和归一化使用标准软件包对样本面板中的每个单独的数据集进行过滤和归一化,以进行单数据集处理: pag
2023-04-17 22:04:16 10.14MB scrna-seq single-cell-rna-seq batch-correction R
1
CytoSPACE:scRNA-seq数据到空间转录组学数据的最佳映射 CytoSPACE是一种新颖的计算策略,用于在空间转录组(ST)测量可能包含多个细胞的贡献的情况下,将单细胞转录组分配给原位空间转录组数据。 我们的方法通过基于线性编程的优化例程将基于相关的成本函数最小化,从而解决了单个像元/点分配问题。 该存储库包含用于实现和评估我们的方法的代码以及一个应用该方法的案例研究。 我们方法的关键创新是: 与常规方法相比,CytoSPACE在单个细胞水平上解剖给定组织中细胞的空间组织。 由于我们的方法从scRNA测序数据中绘制了单个细胞,与可用的空间转录组学技术相比,每个细胞中都有大量的基因被测序,因此我们的方法显着改善了重建组织的基因覆盖率。 我们的方法不需要有关细胞类型和细胞状态的先验知识。 主要实现是作为Python 3软件包。 要查看SpatialDE的用法示例,请继续
2023-03-13 20:25:59 207KB Python
1
GT序列 GT-seq基因分型的标准操作程序,脚本和数据 仓库内容: (1)示例协议:从原始序列读取到完整过滤的SNP数据集的完整基因分型流水线以多种格式。 在浏览器中下载并打开GT-seq_SOP.html (2)示例数据:运行示例协议/ SOP的数据(3)探针序列运行管线所需的数据(4)GT-seq脚本:更新了GTseq管道脚本的存储库(5)面板信息:有关标记的信息,例如引物序列,来源,注释等(6)面板作图:将GTseq标记扩增子与参考基因组作图的结果
2023-02-13 11:04:44 13.6MB HTML
1
chromVAR:染色质跨区域变异(基因组!)
2022-11-12 15:02:06 571KB bioinformatics dnase-seq r atac-seq
1
OCR功能设计,辅助seq2seq,基于pytorch,半成品。
2022-08-22 20:06:10 91.17MB 深度学习 pytorch
1