PanClassif:用于癌癌分类的机器学习分类器管道
这是一个完整的机器学习管道软件包,可用于TCGA癌症RNA-seq基因计数数据。
数据预购
使用TCGA2STAT下载TCGA癌症和正常样本
使用knn-smoothing对上述收集的数据进行平滑处理( )
功能
featSelect(homepath,cancerpath,normalpath,k)
参量
homepath:(str)您要保存所有生成的文件和文件夹的路径。
癌变路径:(str) 所有癌症的癌症基因表达矩阵所处的路径。
normalpath:(str) 所有癌症的正常基因表达矩阵所处的路径。
k:(int)每个癌症要选择的最重要基因的数量。 (默认值:k = 5)您不能将k设置为小于5
dataProcess(homepath,names,cancerpath,smoothed_cancer,smoothed
2021-03-09 19:05:34
200KB
Python
1