GRGNN icon indicating copy to clipboard operation
GRGNN copied to clipboard

关于数据集的几个问题

Open huizhang1032 opened this issue 3 years ago • 0 comments

博主你好,文章的数据集是直接使用的original data文件下的数据吗?如果是的话,那TF是不是基因表达数据矩阵的前面行数,例如,In Silico 数据集总共有1643个节点,Samples 805,那么基因表达数据矩阵M的shape就是(1643×805),而In Silico 数据集的TF 有195个,Target Genes 有1448 个,在M中,前195行是不是就是TF?我在training data文件夹下(net1_expression_data.tsv)查看到的Silico基因表达数据矩阵是把基因第一行按G1到G1643 进行编码排序,training data文件夹下(net1_transcription_factors.tsv)文件,则指G1到G195是TF(转录因子基因)。original data文件下则没有说明。

huizhang1032 avatar May 21 '21 14:05 huizhang1032