TCGA数据库介绍

TCGA数据库介绍,第1张

肿瘤基因组图谱 (TCGA) 计划由美国 National Cancer Institute(NCI) 和 National Human Genome Research Institute(NHGRI)于 2006 年联合启动的项目,目前共计研究 36 种癌症类型。

TCGA 利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制。提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。 最终完成一套完整的与所有癌症基因组改变相关的「图谱」。

TCGA临床数据有两种:

数据文件有 (HTSeq count/ FPKM/ FPKM-UQ)3种

介绍链接

生成raw read counts数据记录==在mirnas.quantification.txt==文件中。多比对用cross-mapped列标注。文件中包括associates miRNA IDs with read count and a normalized count in reads-per-million-miRNA-mapped。

RPM counts记录在 ==isoforms==.quantification.txt文件中。文件中包括miRNA表达量定量分析中的所有列,除此之外还增加了isoforms的基因组坐标信息以及miRNA信息(前体或成熟&accession)

使用Affymetrix SNP 6.0芯片,基于TCGA level 2 数据,最终生成txt文件,包含5列(片段名称,染色体,基因组位置,结合到芯片上的探针数量,seqment_mean)

包括以下几个平台:

文件包括以下这些列:

1、DESeq2需要导入两个数据集:mycounts, colData。先说mycounts,这就是处理完的TCGA数据RNAmatrix.txt,直接读入即可。

2、colData就是对每个样本的一个情况说明。这个可以生成,也可以自己写一个保存为csv格式。我一般自己写。

3、构建矩阵

4、输出结果

Abbr英文名称中文名称

ACC Adrenocortical carcinoma肾上腺皮质癌

BLCABladder Urothelial Carcinoma膀胱尿路上皮癌

BRCABreast invasive carcinoma 乳腺浸润癌

CESCCervical squamous cell carcinoma and endocervical adenocarcinoma宫颈鳞癌和腺癌

CHOLCholangiocarcinoma 胆管癌

COADColon adenocarcinoma结肠癌

COADREADColon adenocarcinoma/Rectum adenocarcinoma Esophageal carcinoma 结直肠癌

DLBCLymphoid Neoplasm Diffuse Large B-cell Lymphoma 弥漫性大B细胞淋巴瘤

ESCAEsophageal carcinoma食管癌

FPPPFFPE Pilot Phase II FFPE试点二期

GBM Glioblastoma multiforme 多形成性胶质细胞瘤

GBMLGG Glioma 胶质瘤

HNSCHead and Neck squamous cell carcinoma 头颈鳞状细胞癌

KICHKidney Chromophobe 肾嫌色细胞癌

KIPAN Pan-kidney cohort (KICH+KIRC+KIRP) 混合肾癌

KIRCKidney renal clear cell carcinoma 肾透明细胞癌

KIRPKidney renal papillary cell carcinoma 肾乳头状细胞癌

LAMLAcute Myeloid Leukemia 急性髓细胞样白血病

LGG Brain Lower Grade Glioma脑低级别胶质瘤

LIHCLiver hepatocellular carcinoma 肝细胞肝癌

LUADLung adenocarcinoma 肺腺癌

LUSCLung squamous cell carcinoma肺鳞癌

MESOMesothelioma间皮瘤

OV Ovarian serous cystadenocarcinoma 卵巢浆液性囊腺癌

PAADPancreatic adenocarcinoma 胰腺癌

PCPGPheochromocytoma and Paraganglioma 嗜铬细胞瘤和副神经节瘤

PRADProstate adenocarcinoma 前列腺癌

READRectum adenocarcinoma 直肠腺癌

SARCSarcoma 肉瘤

SKCMSkin Cutaneous Melanoma 皮肤黑色素瘤

STADStomach adenocarcinoma 胃癌

STESStomach and Esophageal carcinoma胃和食管癌

TGCTTesticular Germ Cell Tumors 睾丸癌

THCAThyroid carcinoma 甲状腺癌

THYMThymoma 胸腺癌

UCECUterine Corpus Endometrial Carcinoma子宫内膜癌

UCS Uterine Carcinosarcoma 子宫肉瘤

UVM Uveal Melanoma 葡萄膜黑色素瘤


欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/sjk/9531068.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存