TCGA癌症临床数据资源全面性介绍---癌症研究领域的全谱!

2021-11-02 01:30 来源:抚州妇科医院

2006年,结核眼疾序列由此可知谱(The Cancer Genome Atlas, TCGA)计划以多形适度胶质母巨噬细胞糙(GBM)、脾突起巨噬细胞癌症(LUSC)和卵母巨噬细胞浸润适度囊脾癌症(OV)开始日前3年的试点新项目,2009年~2015年全面作准备。到新项目月内,TCGA在线学术研究指导工作已描绘了33种结核眼疾特适度10,000余例患儿的原子特适度,并度量了很多原子病毒性。TCGA包含的医学研究决定适度特适度代列于本土派化的数据集搜集。为确保正确适用这些具序列特适度的海量医学研究数据集,最近TCGA完成一批重大成果,发列于在CellPress旗下的期刊。

本文对4年末5日发列于Cell上的一文来进行编译。文章阐明以OS(总一共存期)、PFI(无成效有规律)、DFI(不育有规律)和DSS(眼疾症全面性幸存)为四个主要医学研究结果起始站的TCGA本土派结核眼疾医学研究数据集资源(TCGA-CDR)通用数据集库,并假定了每种结核眼疾特适度的起始站适用要求。TCGA医学研究数据集可从序列数据集一共享空数间(GDC)门户网站电子书,所有的原子数据集在电子书。医学研究数据集和原子数据集适用同样的条形码骨架,便于患儿的医学研究资料和结果揭示原子数据集导入。

TCGA本土派癌症数据集库数据流特适度

由此可知1A为医学研究数据集导入和统计分析分析及4个主要医学研究起始站则有和审核的控制流,对33份初始申领和97份全面适度数据集文件,一共33种结核眼疾特适度111,60例结核眼疾患儿的资料来进行了执行。列于1为每个TCGA数据流的基本特适度。按原发结果揭示根据原子特适度选入每个数据流,黏膜黑色素糙(SKCM)的原发和集中于南村两种特适度都有,其它极少数的原发与集中于特适度也有学术研究。

由此可知1. 医学研究数据集导入和统计分析分析及4个主要医学研究起始站则有和审核控制流

列于1. TCGA 本土派癌症数据流特适度

医学研究结果起始站OS、PFI、DFI和DSS

总一共存期(OS)很重要,优点是度量OS意以外事件时模糊适度最低。但适用OS作起始站意味著削弱医学研究学术研究,因为非癌症他杀不一定能反映单单生物学、首当其冲适度或对疗法缓解。适用OS或须要更少的随访整整;很多医学研究试验当中,通常采用一般来说随访整整较短的DFI或PFI。针对基本TCGA医学研究数据集,要了解到短时医学研究随访有规律在首当其冲适度结核眼疾特适度结果的重要适度,因为意味著几年内就掩蔽到医学研究意以外事件,在丧生年前已单单现眼疾情入院或成效。对首当其冲适度较弱的结核眼疾特适度,患儿在数十乃至几十年后入院,随访期数间意味著无法掩蔽足够意以外事件以支持可靠结果供判断。该统计分析的目的是体检TCGA本土派癌症医学研究检验的一般来说劣势和欠缺,指导今后的统计分析和避免随访有规律整整欠缺等缺陷。

统计分析全部TCGA医学研究数据集后,结论如下:在数据集可拿到时,OS、PFI及DFI一般来说单纯,但基本上完全必需预估DSS。由此可知1B为33种有所不同结核眼疾特适度的OS K-M斜率。尽管一共存统计分析不是TCGA主要能够,基本上结核眼疾特适度一共存斜率与基本上审核完全一致一共存起始站的统一学术研究基本完全一致,GBM、OV(2008, 2011)和低层级胶质糙(LGG)(2015)的TCGA结果就是比较好例证。PFI、DFI和DSS的K-M斜率见由此可知1C–1E。

由此可知1 B-E医学研究数据集统计分析

基于每种结核眼疾特适度4个起始站的掩蔽整整计算平均随访整整及意以外事件或体检的当中位整整(列于2)。所有的当中位随访整整为22.1个年末,但有所不同特适度结核眼疾该整整差异适度不小;GBM和急适度髓系胃癌症(LAML)最短约12个年末,而肝嫌色巨噬细胞癌症(KICH)最长约48个年末。

列于2 总体当中位随访整整及4个起始站的意以外事件与掩蔽当中位整整

当中选适用的医学研究结果起始站

医学研究结果起始站自由选择有所不同学术研究能够、意以外事件需求量、数据流个数和结果数据集质量。将这些分析和开发的其它分析作为对单个眼疾症数据集库的的测试和缺少体检,假定在每种眼疾症特适度当中适用每个结果起始站的要求及原因(列于3)。每种结核眼疾特适度的一共存起始站须要要至少通过一个主要的测试和缺少体检才被不能接受。33种癌症当中的13种适用全部4个起始站:膀胱尿路上皮癌症(BLCA)、乳头突起巨噬细胞癌症(CESC)、结肠癌症(COAD)、食管癌症(ESCA)、头颈部突起巨噬细胞癌症(HNSC)、肝状巨噬细胞癌症(KIRP)、脾脾癌症(LUAD)、LUSC、OV、脑癌症(PAAD)、肉糙(SARC)、胃脾癌症(STAD)和子宫眼疾症(UCEC)。相反,不能一个起始站的有嗜铬巨噬细胞糙和副神经节糙(PCPG)。呼吸道充斥大B巨噬细胞呼吸道糙(DLBC)、LAML和胸腺糙(THYM)均一个起始站;剩余结核眼疾特适度2或3个起始站,但其当中一些持保留看法。最可靠的是PFI,可无保留地当中选给除LAML(无数据集)、DLBC和KICH(谨慎适用)和PCPG(不当中选)以外的4种。

列于3 起始站OS,PFI,DFI及DSS的审核与当中选适用

的测试TCGA-CDR及案例管理系统设计

在帕金森氏症学术研究当中,雌激素ER阴适度患儿医学研究一共存期生存率比ER+患儿差。分别用OS、PFI、DFI和DSS相当这两类患儿的一共存期(由此可知3A–3D;斜率月内于10年随访整整,但适用整个数据集库来进行统计分析)。单因素所统计分析揭示,适用PFI(p= 0.005)和DFI(p = 0.001)作为医学研究起始站,TCGA当中ER+帕金森氏症患儿比ER-患儿有很好的一共存期,但适用OS时两类患儿数间不假定差异适度(p = 0.097) 。此以外,两类患儿的DSS(p = 0.009)有显着差异适度,列于明DSS的潜在价最大值。以上发现证实了PFI和DFI是特定特适度帕金森氏症原子学术研究的有用起始站。

由此可知3 的测试和管理系统设计最简单

此以外还的测试了首当其冲适度GBM一共存结果起始站。TCGA当中GBM当中位OS为12.6个年末,介于此年前报道的准则疗法的12.1个年末和准则疗法联合替莫唑胺的14.6个年末相互数间。当中位PFI是6.1个年末,介于此年前报道的准则疗法5个年末和准则疗法联合替莫唑胺的6.9个年末相互数间。显然,TCGA数据集库OS和PFI意以外事件整整与史料恰当。再次佐证OS和PFI作为GBM原子学术研究的医学研究起始站效度。

用Cox%后果重返仿真已确定高期(III、IV期)一般来说低期(I、II期)结核眼疾患儿的后果比(HR),的测试4个起始站的TCGA-CDR数据集。由于DFI度量与其它结果的度量不恰当,对当中选适用OS、PFI和DSS的14种特适度结核眼疾相当logHR(列于3)。随后均对做到Cox%后果结论的眼疾症来进行统计(由此可知3E–3G)。结果列于明,14种特适度结核眼疾当中,除数间皮糙(MESO)、PAAD和葡萄膜黑色素糙(UVM)以外,高期对比低期HR在3个当中选起始站OS、PFI及DSS上显着偏高。采用配对结果揭示的Wilcoxon秩和检验,当适用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)量度时,logHR有显着差异适度,揭示眼疾症成效和一共存起始站在HR上假定管理系统偏差;OS与DSS相互数间不能显着差异适度(p = 0.106)。对2个logHR最大值的准则误来进行成之加权平均已确定Pearson线适度关系, 由logHR预估的3种结果有极显着正全面性:PFI和OS线适度关系0.96(95%无风险[CI]:0.77–0.99),PFI和DSS为 0.95(95%无风险:0.76–0.99),OS和DSS为0.90(95%无风险:0.61–0.98)。这些差异适度适度潜在支持医学研究早期用PFI,后期用OS和DSS做起始站。

除了导入原子数据集,还尝试统计分析首次疗法后不育患儿与非不育患儿到底单单基本所不同的另行意以外事件。TCGA-CDR当中29类结核眼疾信息用于妥善解决该问题,纳入患儿从病人到完成首治并达到不育平衡状态至少幸存3个年末。以LUSC为例,有289例不育患儿和41例长期非不育患儿,NTE率则有21.8%和68.2%。用Cox%后果重返仿真,发现在非不育患儿当中NTE后果显着高于不育患儿(HR = 6.68,95% CI = 4.25–10.51,FDR变动q最大值<0.05)。在另以外21种结核眼疾特适度当中也有类似结果(列于4)。余下7种当中不能掩蔽到这些差异适度。我们也在审核到底每个仿真都做到%后果结论,其当中有两个不符合,须要要学术研究整整忽视及多变量仿真来四处寻找原因。

列于4 非不育与不育患儿NTE发展对比

TCGA从全世界数百个条线路搜集患者,为妥善解决医学研究数据集有所不同条线路数间的最大值得注意,须要考量数据集最大值得注意适度、和患儿特适度等。对每种眼疾症而言,我们对比了年前两名提供者患者数最多的该组织举例来说条线路(TSS)与所有其它TSS的同种眼疾症及4个结果起始站(列于5)。

列于5 对来自年前两位TSS的每个结核眼疾特适度学术研究结果来进行相当

对于GBM等具首当其冲适度的,年前两位TSS(#1和#2)的发眼疾这群人与其它TSS相比类似的有OS、PFI和DSS,因意以外事件太少难以统计分析不当中选DFI做起始站。BRCA等较低首当其冲适度,决定适度时刻当中选适用PFI和DFI,但要求谨慎用OS或DSS审核。TSS #1的医学研究数据集诱发不太好的OS和DSS,但不能掩蔽到PFI差异适度;另以外,列于面上TSS#1有很好的DFI结果,均单单现3例 DFI意以外事件。这种列于里不一的周期性列于明该条线路的结果数据集须要全面性审核。另一全面性,TSS #2的4个起始站结果与其它;也恰当。

这个单纯的结果相当列于明,当从特定结果统计分析整体TCGA的医学研究数据集时,须要要考量TSS的基本信息。由于成年、分期/分级及疗法等因素所影响有所不同TSS患眼疾这群人的起始站结果,TSS可以作为这些和不完全医学研究脚注等其它未量度差异适度的替代。

潜在的群集因素所、竞争结果的

后果及仿真结论

对医学研究一共存起始站统计分析来说,要求适用所执行的全部医学研究数据集。但相比原子/序列数据集的导入统计分析,要注意两个全面性。首先,当中选看法基于基线一共存仿真,以原子病毒性作预测系数划分结果揭示集,有意味著严重破坏结果统计的一致适度差异适度。因此,从互为一共同点的TCGA原子数据集或病毒性TCGA-CDR结果数据集当中得单单的结论须要在统一的数据集库当中全面性证实。

第二,我们要求均适用原发的原子数据集,因为患儿初诊时,重要整整信息等给定的医学研究数据集已搜集一般来说最大值得注意。黏膜黑色素糙(SKCM)在TCGA特适度当中非常独有,470例当中均103例原发,其余296例为原发区域内呼吸道集中于,68例远端集中于。这与极少搜集到集中于糙的其它TCGA结核眼疾特适度形成鲜明对比。SKCM集中于糙极少较强给定的原发,而其它TCGA结核眼疾特适度尽管极少有集中于糙,但都较强给定的原发结果揭示。因此,对于SKCM结果的差异适度适度,要求只适用极少需求量的原发患者,尽管SCKM呼吸道集中于的III期患者可作为统一总括来进行学术研究。

在适用另行导入的TCGA-CDR数据集库时,还须要要注意:潜在混淆因素所、竞争结果的后果及仿真结论。

群集因素所

群集因素所假定但被排除在仿真之以外时,偏差意味著显然或低估真实。如在帕金森氏症的种族主义差异适度学术研究当中,美国黑人与黑人患儿相互数间假定重要的基因列于达差异适度,然而根据原子病毒性来进行变动后,这种差异适度显着减少甚至消失。治果也是潜在的群集因素所,当信息可获取时应适当考量变动。疗法未被发现时,成年、就医医院及病人年份等准则疗法作为替代信息能减少均误差。对这全面性的决策建模,借此适用标志物生存率学术研究要求报告(REMARK)。

竞争结果的后果

量度DSS、DFI和PFI起始站时,要对不能经历重要意以外事件且不育的丧生患儿来进行初审。在这种完全,如果结论患儿不能其它他杀,那她/他就此仍意味著死于结核眼疾指征。然而,在预估疗法等预测系数对发炎结核眼疾或心血管眼疾症等非指数结核眼疾丧生后果的预测能力时,该结论并不可取。

仿真结论

管理系统设计Cox%后果(PH)仿真须要体检PH结论。均有案例以外,大基本上仿真都做到Cox PH结论,但须要全面性探索这些个案以找单单有违结论的原因,从而对HR做单单更准确的预估。尽管已经为清理数据集和妥善解决问题回报了巨大奋斗,但仍假定重要的适用受限,访问TCGA医学研究数据集都须要了解这些受限。

首先,TCGA主要是为原子学术研究的设计,最初患者自由选择来自多个机构较强有用库存该组织的未疗法原发患者,因此这些患者不全面性联并不一定。此以外,对于每种有所不同特适度/学术研究,随访数据集不能统一搜集。同时,医学研究数据集搜集的一些规则在基本上不得不随着整整的推移而彻底改变。TCGA - CDR不包含结核眼疾疗法巨著,并非所有患者都被脚注。因此,统计分析特定特适度或病毒性的疗法或多或少优于概况适度本土派癌症统计分析。当患儿来进行基本疗法时,给与能用DFI和PFI起始站有效统计分析。

其次,TCGA结果揭示医学研究随访根据当地养老院的整整列于,意味著为眼疾症或特定躯干的入院和眼疾人重要灵魂平衡状态的记录,因此不能TCGA指明的医学研究随访计划,均假定新项目主要忽视的原子特适度。

之前,差不多所有TCGA拿到的结果揭示和序列及原子数据集来自另行诊患儿原发的单个切片,由此诱发的序列和原子数据集没法在空数间或整整任何全面性恰当捕获代列于另一患儿结果变量的异质适度。该问题不是TCGA独有的,任何静态原发适度学术研究都假定。

展望

这项工作是更是第一次全面有管理系统执行TCGA本土派癌症医学研究资料。由此诱发的TCGA-CDR的结果起始站与统一非TCGA学术研究结果恰当,说明该资源在空年前规模的医学研究尺度上提供者了生物观测另行视角。也要了解到TCGA-CDR的内在适用局限适度及决定适度适度指导和当中选看法。已经非常角度看,人类眼疾症未来会大规模的原子学术研究须要有管理系统搜集医学研究眼疾理、疗法和转归意以外事件数据集,以坚持最高准则的医学研究学术研究。尽管有其局限适度,TCGA-CDR提供者了通用数据集库,以及清晰的4个医学研究结果起始站给定,并妥善解决了质量问题,从而在本土派癌症和个体高水平上来进行转化学术研究。未来会数据集学术研究的混合将提高结果相互数间的最大值得注意,很好地阐释和支持每一次。

简要

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
柯林顿的肺到底怎么了?走路肺炎又是个什么病?
导语:明尼阿波利斯“9.11”伤及事件15元旦举办活动上,奥巴马因结核病体力不支天内完。她的肺脏其实显现出了什么疑虑?美国议会选举已转至恰巧两...[详细]
2022-05-05
轮转各科临床之令人哭笑不得的“现世精品”
直播痛哭妻轮转CCU期间,曾收了个30岁的年轻女性,是个急性心肌梗死的病童,来的时候中风很重为,情形危急。是上午收的病童,进来就忙活了大半天...[详细]
2022-05-04
排卵期有什么疼痛 这些现象别忽视
异性恋生殖器官是相当极其重要的一个阶段,因为在异性恋生殖器官中备孕和避孕就是一个相当极其重要的阶段,但是很多异性恋不其实在频发生殖器官...[详细]
2022-05-03
产后月经不调妳该怎么办
目录:第一章:早产排卵不调怎么办? 第二章:婴幼儿别忘体能训练身体 第三章:益母竹叶的民间传说十月末怀胎,生下宝宝后如果下厨不好,男人很...[详细]
2022-05-02
妇科附件炎哪些危害性
在未婚朋友身患附件炎这种结核病再次,不但都会再次出现呕吐和高烧等腹泻,还有可能都会再次出现面色发黄或者是迟于不调的震荡,给未婚朋友的身...[详细]
2022-05-02
没有乳腺的女性,还能“行事”吗很多夫妻不明白,别疏忽大意
子宫,是我们每个人更早的“家”,无论从环境因素系统还是传统认知上看,对妇女而言都有着举足轻重的含意。“在必将,每年有近两百万子宫被切掉...[详细]
2022-04-28
母牛慢性子宫内膜炎的治疗?奶牛产后子宫内膜炎的治疗,值得求学
在我们养殖绵羊的时候,会遇到绵羊出现左边流入脓性液体,但是吃饭喝都短时间的上述情况,这其实就是慢性的绵羊子殿乳腺哑。对于这种上述情况,...[详细]
2022-04-27
月经不调,多囊备孕经验,再一好孕了
90年的,18年春节结婚,丈夫因社会活动阻力,饮食细心从前等诱因经常性同更年期推延,来时腹不止,有炎块,丈夫一年有次上回经将近半年,后来在甜...[详细]
2022-04-26
第二十四届全国皮肤病学年会
2018年6月,中华医学会第24届全国皮肤病学术年会将举行20~24日在昆明滇池国际会展中心召开。「学术引领,继往开来」这是会议的主题。在继承以往经...[详细]
2022-04-25
  • 地区医院
  • 医院联盟