
一个。
一个数据集就够了,多个数据集合需要合并为一个。一个基于TCGA数据库,不需要注册登录即可进行可视化分析的网页,不需要代码,里面内容十分丰富,提供了最详细的TCGA在线分析展示。
cBioPortal显着降低了复杂基因组数据与癌症研究人员之间的获取障碍,促进快速、直观、高质量地获取大规模癌症基因组学项目的分子谱和临床预后相关性。目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据。
期刊:Cancer Cell;影响因子:26602
发表单位:麻省理工学院等
肿瘤的传统分类利用了起源组织和组织学类型,这些类别已通过针对大量肿瘤的全面分子表征进行了完善。胃肠道腺癌(GIAC)不仅预后不良,而且分子特征也保守,具有类似的内胚层发育起源和暴露于促进肿瘤形成的常见损伤。根据组织来源和分子亚型,超突变的肿瘤表现出多种免疫功能,这对靶向免疫治疗具有重要意义。来自2019年4月发表在《Cancer Cell》上的一项研究中,通过评估区分胃肠道腺癌与其他癌症的基因组和表观差异,讨论了胃肠道腺癌跨解剖学边界的分子特征并提供了对这些恶性肿瘤发病机制的了解。
研究人员分析了921例食道、胃、结肠和直肠腺癌,以检查胃肠道腺癌(GIAC)的共有和区别分子特征。高突变(HM)肿瘤与癌症类型无关,包括那些富含插入/缺失的肿瘤,代表了在CpG岛甲基化表型(CIMP)背景下MLH1表观遗传沉默的微卫星不稳定病例,以及与极突变相关的单核苷酸变异(HM-SNV)升高的肿瘤。具有染色体不稳定性(CIN)的肿瘤具有多样性,胃食管腺癌具有与基因组加倍相关的片段化基因组和明显的突变特征。研究确定了一组结肠和直肠肿瘤,它们缺乏称为基因组稳定(GS)的超突变和非整倍性,并且富含KRAS、SOX9和PCBP1中的DNA超甲基化和突变。
胃肠道腺癌包含五种分子亚型:EBV、MSI、HM-SNV、CIN和GS;
超突变的肿瘤具有不同的免疫特征,并随组织和亚型而异;
CIN肿瘤在上消化道中显示出更多的片段拷贝数变化;
基因组稳定的结肠癌亚型中存在SOX9和PCBP1超突变的富集。
数据获取自TCGA 921例原发的、未接受过放化疗的胃肠道腺癌的新鲜冰冻组织(包括79例食道癌、383例胃癌、341例结肠癌和118例直肠癌),其中76例有正常的癌旁组织。数据包括单核苷酸多态性(SNP)阵列、体细胞拷贝数(SCNA)阵列、全外显子组测序、DNA甲基化阵列、mRNA测序、microRNA测序以及部分样本的反相蛋白阵列(RPPA)。
为了找到区分GIAC于其他来源腺癌(非GIAC)的分子特征,作者首先从突变、拷贝数变异、表达和甲基化水平描述了GIAC的一般特征。与非GIAC相比,GIAC中CpG岛超甲基化频率以及体细胞突变的平均密度更高。所有GIAC中都观察到了频繁的SCNA,尤其是在食道腺癌(EAC)、卵巢和部分非GIAC的乳腺癌中。GIAC中的高频突变基因包括FBXW7、SMAD2、SOX9和PCBP1。染色体13q的臂级扩增是GIAC特有的,此扩增区域中两个转录因子CDX2(13q122)和KLF5(13q221)可能与GIAC发病机理有关。优先在GIAC中观察到APC和SOX9缺失,以及这些基因中的频繁突变。基因表达分析显示,51个基因在GIAC中的表达显著更高,包括在胃肠干细胞生物学中起作用的几种基因(例如 OLFM4、CD44和KLF4)以及与EGFR信号通路相关的基因。扩增被认为是功能获得(GOF)事件,而缺失、表观遗传沉默以及无义或插入缺失突变被认为是功能丧失(LOF)事件。作者还调查了在GIAC中编码139个对GI发展至关重要的转录因子的基因是否与GIAC中显示出明显的功能丧失事件有关。在至少一种GIAC肿瘤类型中,发现了33个GOF或LOF超过5%的转录因子基因。
确定了胃肠道腺癌具有独特的分子特征后,作者继续探究分子分型。921例样本中有30例为EB病毒高负荷,并且只在胃腺癌中发现,称为EBV+亚型。剩下的891例基于突变密度一分为二,高突变密度组又分为HM-SNV单核苷酸高突变型和MSI微卫星不稳定型,而低突变密度组又分为CIN染色体不稳定型和GS基因组稳定型。分子分型与GIAC的关键免疫特征相关,EBV+和MSI肿瘤表现出较大的IFNγ特征,HM-SNV中发现HLA/抗原呈递的减弱和NK细胞基因表达的显著升高。使用癌症相关的甲基化位点对GIAC的DNA甲基化数据进行聚类,显示EBV+胃癌中广泛的CpG岛甲基化。超突变的肿瘤主要位于胃肠道的中部、胃远端和结肠近端,而CIN肿瘤在解剖学上的极端、食道和结肠/直肠远端更普遍。高CIMP遍及整个上消化道和近端结肠,导致MSI的MLH1表观遗传沉默主要发生在远端胃和结肠近端。
MSI肿瘤的特征和组织来源无关,提示这类肿瘤具有共同的生物学特征。考虑到大多数MSI病例在高CIMP的背景下都是由于启动子DNA高甲基化导致MLH1的表观沉默,作者探究了不同CIMP亚型的基因突变景观:高CIMP亚型仅在结肠中与BRAFV600E突变相关,低CIMP亚型富含KRAS突变;高CIMP亚型普遍存在肿瘤抑制基因CDKN2A的甲基化,TFAP2E启动子甲基化存在于大部分高CIMP亚型中。一部分同时缺乏MLH1甲基化和CIMP表型的MSI病例在MLH1或MSH2中包含体细胞突变,这表明DNA错配修复丧失的途径。与非高CIMP MSI病例相比,高CIMP MSI显示APC或CTNNB1突变的组合频率以及WNT基因表达降低。所有亚组中的表观遗传沉默基因的途径分析表明,编码DNA结合蛋白和转录因子的基因富集。
尽管结肠癌基因组的受影响区域总体上相似,但SCNA的格局显示胃食管腺癌比结肠癌相具有更精细的片段化基因组。上GI和下GI的局部扩增差异大于缺失的差异,特别是高水平局灶性扩增。与CIN-B胃食管腺癌相比,CIN-F胃食管腺癌的全基因组重复(WGD)明显更多,对编码RTK、KRAS和细胞周期介体的基因的扩增显著更频繁,以及更高的TP53突变频率和癌基因扩增率。CIN-F胃食管腺癌与晚期肿瘤相关,强调了其潜在的临床意义。与CIN-F结肠癌相比,CIN-B结肠癌中PIK3CA突变和TGFβ途径改变更普遍。在CIN-B胃食管腺癌组中,癌基因通过突变而不是通过扩增被激活,早期APC丢失和选择致癌基因(如KRAS)的突变激活的优势可能先于非整倍体和转化的形式出现。
CIMP+CIN CRC结肠癌中体细胞突变的频率明显较高,特别影响TGFβ途径的关键癌基因,表明CIMP状态可能在塑造下消化道CIN肿瘤的发展中起重要作用,而在上消化道的CIN肿瘤的形成中起较小的作用。尽管结肠癌通常在超突变/MSI和CIN之间进行划分,但作者检测到既缺乏非整倍性/CIN又缺乏超突变的结肠癌人群,将该组归为GS。突变分析显示,13%的GS结肠癌的PCBP1的KH域中存在高度聚集的错义突变,增加了发生GOF事件的可能性。GS结肠癌与CIN结肠癌的比较显示,非CIMP CIN结肠癌,高CIMP或低CIMP CIN结肠癌与GS结肠癌之间的特征逐渐分级,表明了包含低CIMP表型的APC突变细胞能够通过维持其他致病性突变而进行转化,而无需p53丢失或非整倍性。此外,作者还讨论了APC突变引起的高CIMP表观遗传畸变引发的另一种结肠癌途径。
由于MSI和低GI HM-SNV组中MSI和POLE缺陷型肿瘤的高突变负担,在GIAC中,MSI和POLE标记是主要的特征得分。去除超突变病例后的标记发现BRCA标记、两个APOBEC标记、类似于COSMIC标记17的标记和常见的AA>AC转换,以及在CpG二核苷酸处以C>T转换为主的标记。APOBEC标记存在于整个GIAC中,但其他3个标记在非高变GIAC中具有实质性的活动,AA>AC标记仅限于上GIAC。BRCA标志活性与上消化道癌(尤其是CIN亚型)之间存在显著相关性,AA>AC标记富集于CIN-F和TP53突变的上GI CIN肿瘤中。CpG>TpG模式,通常称为衰老标记,在右侧结肠癌中尤为常见。CIMP状态与CpG>TpG标记之间的关联可能反映了CIMP肿瘤需要更多的细胞分裂才能进展,因此随着时间的推移会获得更多的CpG>TpG突变。
本研究分析了921例胃肠道腺癌,鉴定了其区别于其他癌症的分子特征。将GIACS分为5种分子亚型,发现高突变肿瘤具有不同的免疫特征,取决于组织来源和分子亚型。而低突变密度组,染色体不稳定的上消化道腺癌表现出更多片段化的拷贝数变异,伴有基因组加倍和明显的突变特征,基因组稳定的结直肠腺癌富集SOX9和PCBP1基因突变。结果强调了DNA超甲基化和CIN等过程如何在相关组织中以不同的方式表现出来,在分子缺陷的各种表现形式中提供更详细的信息可能揭示针对这些癌症的靶向疗法的新机会。
1ACCAdrenocortical carcinoma肾上腺皮质癌
2BLCABladder Urothelial Carcinoma膀胱尿路上皮癌
3BRCABreast invasive carcinoma乳腺浸润癌
4CESCCervical squamous cell carcinoma and endocervical adenocarcinoma宫颈鳞癌和腺癌
5CHOLCholangiocarcinoma胆管癌
6COADColon adenocarcinoma结肠癌
7READ Rectum adenocarcinoma Esophageal carcinoma结直肠癌
8DLBCLymphoid Neoplasm Diffuse Large B-cell Lymphoma弥漫性大B细胞淋巴瘤
9ESCAEsophageal carcinoma食管癌
10FPPPFFPE Pilot Phase IIFFPE试点二期
11GBMGlioblastoma multiforme多形成性胶质细胞瘤
12GBMLGGGlioma胶质瘤
13HNSCHead and Neck squamous cell carcinoma头颈鳞状细胞癌
14KICHKidney Chromophobe肾嫌色细胞癌
15KIPANPan-kidney cohort (KICH+KIRC+KIRP)混合肾癌
16KIRCKidney renal clear cell carcinoma肾透明细胞癌
17KIRPKidney renal papillary cell carcinoma肾乳头状细胞癌
18LAMLAcute Myeloid Leukemia急性髓细胞样白血病
19LGGBrain Lower Grade Glioma脑低级别胶质瘤
20LIHCLiver hepatocellular carcinoma肝细胞肝癌
21LUADLung adenocarcinoma肺腺癌
22LUSCLung squamous cell carcinoma肺鳞癌
23MESOMesothelioma间皮瘤
24OVOvarian serous cystadenocarcinoma卵巢浆液性囊腺癌
25PAADPancreatic adenocarcinoma胰腺癌
26PCPGPheochromocytoma and Paraganglioma嗜铬细胞瘤和副神经节瘤
27PRADProstate adenocarcinoma前列腺癌
28READRectum adenocarcinoma直肠腺癌
29SARCSarcoma肉瘤
30SKCMSkin Cutaneous Melanoma皮肤黑色素瘤
31STADStomach adenocarcinoma胃癌
32STESStomach and Esophageal carcinoma胃和食管癌
33TGCTTesticular Germ Cell Tumors睾丸癌
34THCAThyroid carcinoma甲状腺癌
35THYMThymoma胸腺癌
36UCECUterine Corpus Endometrial Carcinoma子宫内膜癌
37UCSUterine Carcinosarcoma子宫肉瘤
38UVMUveal Melanoma葡萄膜黑色素瘤
来自: >
关于gtex数据怎样筛选。
1、通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据,只有区区100个左右的正常对照。
2、这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。这里值得大力推荐的是GTEx数据库,Genotype-TissueExpression(GTEx)。
以上就是关于生信分析需要几个数据集全部的内容,包括:生信分析需要几个数据集、多组学高分文献18-胃肠道腺癌的比较分子分析、TCGA / 癌症简称 / 缩写 / TCGA癌症中英文对照等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)