2024年4月6日发(作者:)
ucscxena浏览器才是最简单的tcga数据下载途径
不知道为什么总是有人问我TCGA数据下载这么简单
的问题,这问题简单到如何下载人类的这个参考基
因组一下,就是
/goldenpath/hg19/bigZips/chrom
这么简单的一个链接,放在浏览器下载个把小时或
者几分钟即可。那,为什么TCGA的数据下载会有那么多人
询问呢?无法就是按照癌症区分了一下,几十种而已,再就
是按照数据类型区分一下,就6种数据而已。我在论坛也写
过 关于TCGA数据下载,我能说的就是这些了 ,里面推荐
了8种方便的方式来下载TCGA数据,但既然这么多人问,
我就再啰嗦一句,如果你不懂代码,不懂网站规则,那么最
简单的就是UCSC xena 浏览器啦!!!
网站;/datapages/ 全部根据癌症种类
整理好了,直接点击链接即可下载。同时也提供相应的可视
化工具:/heatmap/ 点击进入任何一个
癌症数据:数据排列的整整齐齐,进入就是直接的下载链接,
没什么好说的,当然,如果你懂url,就明白,这些链接是有
规律的。所以你没必要进入页面一个个下载了,只需要按照
规律来构建好下载url即可。看规律
/download/TCGA-LAML/Xena_Matric
es/_s:///d
ownload/TCGA-ACC/Xena_Matrices/_count
s:///download/TCGA-LAML/Xena_
Matrices/s:///
download/TCGA-ACC/Xena_Matrices/_phen
s:///download/TCGA-ACC/Xe
na_Matrices/s:///
download/TCGA-BRCA/Xena_Matrices/
看规律如果你跟着我学习了那么久,却连个规律都看不
清楚,不会写代码把所有的url地址拿到,我觉得你可能悟
性太差或者敷衍了事,你需要反思,真的还能在生物信息学
这条路走下去吗?看规律可以看到,就是表达量文件稍微大
一点而已,几分钟就下载好了。癌症种类列表如下:
GDC TCGA Acute Myeloid Leukemia (LAML)GDC TCGA
Adrenocortical Cancer (ACC)GDC TCGA Bile Duct Cancer
(CHOL)GDC TCGA Bladder Cancer (BLCA)GDC TCGA
Breast Cancer (BRCA)GDC TCGA Cervical Cancer
(CESC)GDC TCGA Colon Cancer (COAD)GDC TCGA
Endometrioid Cancer (UCEC)GDC TCGA Esophageal Cancer
(ESCA)GDC TCGA Glioblastoma (GBM)GDC TCGA Head
and Neck Cancer (HNSC)GDC TCGA Kidney Chromophobe
(KICH)GDC TCGA Kidney Clear Cell Carcinoma (KIRC)GDC
TCGA Kidney Papillary Cell Carcinoma (KIRP)GDC TCGA
Large B-cell Lymphoma (DLBC)GDC TCGA Liver Cancer
(LIHC)GDC TCGA Lower Grade Glioma (LGG)GDC TCGA
Lung Adenocarcinoma (LUAD)GDC TCGA Lung Squamous
Cell Carcinoma (LUSC)GDC TCGA Melanoma (SKCM)GDC
TCGA Mesothelioma (MESO)GDC TCGA Ocular melanomas
(UVM)GDC TCGA Ovarian Cancer (OV)GDC TCGA
Pancreatic Cancer (PAAD)GDC TCGA Pheochromocytoma &
Paraganglioma (PCPG)GDC TCGA Prostate Cancer
(PRAD)GDC TCGA Rectal Cancer (READ)GDC TCGA
Sarcoma (SARC)GDC TCGA Stomach Cancer (STAD)GDC
TCGA Testicular Cancer (TGCT)GDC TCGA Thymoma
(THYM)GDC TCGA Thyroid Cancer (THCA)GDC TCGA
Uterine Carcinosarcoma (UCS)


发布评论