GTEx数据集(V8)的条件变量自动编码器
该项目旨在使用生成模型生成合成基因表达数据。 我们首先研究数据的3D表示形式以及可能要依据的变量,以便有效地分离分布。 当前模型以组织为条件。
组织着色的GTEx数据集(1000个随机基因)的3D表示形式(UMAP,TSNE,PCA):
CVAE当前的重建质量,取决于组织。
基于:
对VAE方差损失论文: , ,
项目进度:
基准模型创建
评估潜在空间中的均值,绝对差和分组的函数
模型调整
潜在空间大小
批次大小,学习率(应尽早确定时期数)
附加致密层的数量,每个附加层中神经元的数量
有条件的VAE模型(条件之一:组织或年龄)
b-VAE模型(损失函数中的MSE / KL散度权重)
相关的VAE( )
torch_model.py神经网络的层和属性
gtex_loder.py加载基因表达数据集
torch_train
1