老哥学习网 - www.lg9.cn 2024年05月18日 06:12 星期六
当前位置 首页 >公文范文 > 公文大全 >

肺腺癌中综合分析竞争性内源RNA网络预测潜在的预后lncRNA

发布时间:2023-04-05 12:35:08 浏览数:

黄银龙,连超群,孙康,张志强,邓娇娇,张静*

(1.蚌埠医学院生命科学学院,安徽 蚌埠 233030;
2.检验医学院)

当前肺腺癌是促使癌症患者死亡的因素之一[1],尽管肺腺癌的治疗方法不断的改进,但是肺腺癌的预后效果还是相对较差[2],肺腺癌晚期患者的癌细胞会发生侵袭和转移,导致对患者的治疗效果较差[3]。肺腺癌的发生和发展机制难于探索,预防和治疗肺腺癌还是人类面临的巨大挑战之一。因此更好地理解肺腺癌的侵袭和转移的基础机制,并且鉴定出与肺腺癌相关的新诊断方法和预后生物靶标是目前的主要任务。

构建lncRNA、miRNA和mRNA的竞争性内源RNA(ceRNA)网络。lncRNA和mRNA可以直接与miRNA结合,因而lncRNA可以作为内源竞争性分子与miRNA结合从而间接地调控mRNA的表达[4]。这种间接的lncRNA-mRNA调节关系的作用已被证明与多种癌症发生发展直接相关。例如,已证明DGCR5通过竞争性结合hsa-mir-22-3p促进Bcl-2的上调,从而促进肺腺癌细胞的增殖和转移[5]。但是缺乏可供查询的与肿瘤相关的lncRNAmiRNA-mRNA关系的ceRNA网络数据库,进而难以理解许多癌症病理学基础。

癌症基因组图谱(TCGA)是一个大型公共数据库,存储30多种人类癌症相对应的数据,包含患者的大量临床病理信息[6]。鉴于其强大的特性,TCGA非常适合数据挖掘工作,探索肿瘤发展的基础机制。该数据库已被用于肝癌[7]、乳腺癌[8]、胃癌[9]和舌鳞状细胞癌[10]等肿瘤类型ceRNA网络的构建。此类ceRNA网络主要用于强调复杂遗传关系和鉴定潜在的预后或治疗性生物标志物。

本研究主要比较肺腺癌患者组织样品中的lncRNA、miRNA和mRNA与正常组织样品之间的差异表达,并关注这些差异表达基因与肺腺癌分期的关系。然后运用肺腺癌不同阶段之间通用的差异RNAs(lncRNA、miRNA、mRNA)构建与肺腺 癌 相 关 的ceRNA网 络。通 过miRcode、TargetScan、miRDB和miRTarBase数据库预测了不同差异RNAs之间的关系,以预测它们之间的相互作用关系。获得由170个lncRNA、14个miRNA和66个mRNA组成的ceRNA网络。由此产生的网络关系可以提供有价值的并且能快速识别肺腺癌相关的差异基因。此外,我们通过Cox回归模型等分析方法生成基于6个lncRNA的风险评分模型,该模型能够预测肺腺癌患者的生存结果,从而突出了该研究方法的价值。

1.1 数据与预处理从TCGA数据库中下载肺腺癌患者的lncRNA、miRNA、mRNA及其相关的临床数据[11-12]。一共获得594个样本,其中包括535个癌症样本和59个正常样本。运用perl[13]提取样本信息并转化成矩阵文件,使用Ensemble数据库把RNA矩阵数据中的基因序列号转换成基因名[14]。对包含3种RNA类型、生存时间、生存状态和分期的样本进行分析,确保每个样本中包含miRNA、lncRNA、mRNA数据以及用于预后分析的临床数据。

1.2 筛选差异基因根据临床数据的肿瘤分期人为设定为前期(Ⅰ~Ⅱ期)、后期(Ⅲ~Ⅳ期),提取前期、后期、正常样本中的RNAs数据。应用R软件中的edgeR包[15-16]将前期样本和后期样本分别与正常样本进行RNAs差异分析,设定P<0.01,|logFC|>1作为差异分析的标准[17]。将得到lncRNA、miRNA和mRNA的差异基因用R软件包gplots绘制火山图[18],使用R软件中的VennDiagram包获得通用差异RNAs[19]。

1.3 ceRNA网络的构建运用miRcode[20]预测差异lncRNA在miRNA中的目标基因,使用miRDB[21]、miRTarBase[22]、TargetScan[23]预 测miRNA在mRNA的靶基因,从而获得差异lncRNAmiRNA-mRNA的网络关系,应用Cytoscape软件对该网络关系进行可视化[24]。

1.4 mRNA生物学功能与通路分析基因本体(gene ontolontolgy,GO)和京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)对ceRNA网络中的mRNA进行富集分析,从而研究肺腺癌发生的分子基础。利用R软件中的clusterProfiler包[25]对mRNA进行GO分析[26](生物过程、细胞组成、分子功能)和KEGG分析[27](生物学通路),设定筛选标准为P<0.05。

1.5 生存分析鉴于lncRNA在生命调节中独特的生物学意义,因此对ceRNA网络中的差异lncRNA进行了单变量Cox回归模型分析[28],进而揭示其在肺癌患者生存时间之间的关联。应用R软件中的survival包对其分析,计算危险比(HR)和相应的95%可信区间(95%CI),筛选标准为P<0.05。

1.6 构建风险模型使用R软件中的survminer包对单因素回归分析得到的显著性lncRNA进行风险模型构建,然后计算每个样品的风险值,并根据生存中位值对每例患者进行分组,分为高风险组与低风险组。应用R软件对分组情况进行可视化得到风险图和状态图。通过R软件对每个样本进行生存曲线分析,最后运用ROC曲线确定我们生存曲线模型的准确性。

1.7 独立预后分析通过单变量Cox分析,初步评定了特定的临床信息(年龄、性别、肿瘤分级、TN分期、病理分期)与肺腺癌患者的关系。通过单变量Cox分析,将P<0.05的变量纳入多变量分析中作为候选变量。在多变量Cox回归模型分析中[29],评定HR和相应的95%CI,筛选标准为P<0.05。

1.8 PPI网络构建和预测评估通过回归分析得到的lncRNA构建与肺腺癌患者预后相关的子网络,使用STRING对该网络中的mRNA进行蛋白质-蛋白质互作分析。随后应用Cytoscape的插件CytoHubba从lncRNA-mRNA网络中挑选出9个关键基因。利用R软件对6个lncRNA和9个mRNA相关性分析。运用在线软件Kaplan-Meier对显著性相关的核心基因进行生存分析,评定标准为P<0.01,|R|>0.3。利用在线GEPIA软件对8对lncRNA-mRNA关系对中的基因在癌症和正常组织中的表达情况进行分析。

2.1 lncRNA、mRNA、miRNA差异表达鉴定为了识别肺腺癌分期相关的差异RNAs,将下载的样本分为正常样本(n=59),肺腺癌早期样本(Ⅰ~Ⅱ期,n=403)和肺腺癌晚期样本(Ⅲ~Ⅳ期,n=111)。然后将早期肺腺癌样本和晚期肺腺癌样本分别与正常样本比较,获得差异lncRNA、miRNA和mRNA,筛选条件为|logFC|>1和P<0.01(图1)。比较了早期和晚期样本的差异lncRNA、miRNA和mRNA,得 到 通 用 的4 847个mRNA、2 070个lncRNA和232个miRNA。这些差异表达的重叠基因可能同时导致癌症的发生与发展,因此为了更好地理解这些已识别的差异RNAs(lncRNA、miRNA、mRNA)之间的调控关系,需要更进一步对lncRNA-miRNA和miRNA-mRNA的关系对进行研究。

图1 肺腺癌相关的差异RNAs的鉴定

2.2 鉴定lncRNA-miRNA相互作用关系利用重叠差异RNAs鉴定lncRNA-miRNA之间的关系。详细的流程见图2。首先使用miRcode数据库查找2 070个lncRNA的目标基因miRNA。确定了87个能代表差异miRNA的miRNA。最后预测到190个lncRNA和36个miRNA之间存在相互作用关系。

2.3 鉴定miRNA-mRNA相互作用关系使用重叠差异miRNA鉴定miRNA-mRNA之间的相互作用关系。详 细 流 程 见 图2。首 先 利 用miRDB、miRTarBase和TargetScan数 据 库 查 找232个 差 异miRNA的靶基因mRNA,然后将得到的靶基因(mRNA)与差异mRNA比较取交集。最后我们预测到66个mRNA和14个miRNA之间存在联系。

图2 ceRNA网络构建的流程图

2.4 ceRNA网络构建利用lncRNA-miRNA和miRNA-mRNA关系对,最终得到190个lncRNA和66个mRNA。又通过lncRNA-miRNA-mRNA关系对删除部分lncRNA-miRNA与miRNA-mRNA关系对。最终得到170个lncRNA、14个miRNA和66个mRNA,设定阈值为P<0.05。运用Cytoscape软件构建了ceRNA网络(图3)。

图3 构建与肺腺癌相关的ceRNA网络

2.5 富集分析通过GO和KEGG数据库对ceRNA网络中的66个mRNA潜在的生物学功能和生物学通路进行富集分析。发现mRNA在24种生物学过程中显著富集(adjustedP<0.05)。mRNA主要参与RNA聚合酶Ⅱ特异性、DNA结合转录激活剂活性、L-谷氨酸跨膜转运蛋白活性、Wnt信号体等生物学功能(图4A)。得到mRNA在4种KEGG通路显著性富集(adjustedP<0.05),包括AGE-RAGE信号通路、转录失调、氨基酸的生物合成(图4B)。这些结果表明AGE-RAGE信号通路、转录失调通路对肺腺癌发展起到重要的调节作用。

图4 ceRNA网络中66个差异表达mRNA的功能富集分析

2.6 与肺腺癌生存相关的lncRNA为了确定与肺腺癌生存显著性相关的lncRNA,对ceRNA网络中的lncRNA进行了单因素回归模型分析,最后得到7个与肺腺癌患者的整体生存期显著性相关的lncRNA,DGCR5(HR=1.000 398,95%CI:1.000 01~1.000 787,P<0.05),LINC00536(HR=1.021 126,95%CI:1.004 467~1.038 062,P<0.012 739),ATG9B(HR=0.999 15,95%CI:0.998 46~1.000 787,P<0.015 752),FGF14-IT1(HR=0.868 353,95%CI:0.766 564~0.983 659,P<0.026 489),ANO1-AS2(HR=1.006 849,95%CI:1.002 042~1.011 679,P<0.005 18),ST7-AS2(HR=1.001 523,95%CI:1.000 077~1.002 972,P<0.038 976),SYNPR-AS1(HR=0.994 116,95%CI:0.988 899~0.999 362,P<0.027 961)

2.7 构建lncRNA相关风险评分系统鉴于lncRNA明确的表达方式和在ceRNA网络中的顶层调节因子作用,因此我们认为其可以作为肺腺癌诊断和预后治疗的理想的生物标志物。使用R软件survminer包对7个显著性lncRNA构建Cox回归模型,得到6个lncRNA(DGCR5、LINC00536、ATG9B、FGF14-IT1、ANO1-AS2、SYNPR-AS1)(P<0.05)与风险评分模型,风险值:0.000 553 593×DGCR5+0.019835865×LINC00536+(-0.000941518)×ATG9B+(-0.109 168 446)×FGF14-IT1+0.007 943 741×ANO1-AS2+(-0.005 158 638)×SYNPR-AS1。使用上述公式确定了所有样本的患者的风险得分,并根据风险得分是否大于1.245 336(风险中位值)将患者分成高风险组(n=169)和低风险组(n=169)。运用R软件对分组情况进行可视化得到风险图(图5A)和状态图(图5B),可以清晰地得出患者样本在高低风险组的分布状况。根据分组情况,利用R软件绘制高低风险组的生存曲线(图5C),可以得出风险模型把患者分为高低风险组,高风险组的死亡率高于低风险组。并利用R软件中的survival包绘制ROC曲线(图5D)验证生存曲线的准确性,证明生存曲线具有一定的可靠性。运用单因素独立预后分析,验证肺腺癌患者中与总生存时间相关的临床因素(图5E),又运用多变量Cox回归分析,探索与总生存时间相关的临床独立因素(图5F),单因素分析发现肿瘤分期(Stage)、淋巴结(N)、远处转移(T)和风险模型值可以作为独立预后因子,多因素分析发现风险模型值可以作为独立预后因子。

图5 lncRNA相关风险评分系统

2.8 PPI网络构建和预后评估根据风险模型得到的6个lncRNA构建了预后子网络(图6A),并使用该网络中的mRNA构建PPI网络(图6B)。从该网络中 挑 选 了9个 核 心 基 因(FGF2、CCNB1、TGFBR2、ALDOA、BDNF、COL1A1、MCM4、PBK、SLC1A1)用于进一步研究。根据lncRNAmiRNA-mRNA的关系,理论上我们认为lncRNA可以调节mRNA的表达。因此对6个lncRNA和9个mRNA进行了相关性分析,结果得到8对lncRNAmRNA(|R|>0.30),具 体 是FGF2、CCNB1、ALDOA、COL1A1和MCM4与6个lncRNA显著相关(图7)。然后利用Kaplan-Meier数据库绘制FGF2、CCNB1、ALDOA、COL1A1和MCM4的总生存时间曲线(图8)。利用GEPIA数据库分析了8对lncRNA-mRNA关系对中的基因(FGF2、CCNB1、ALDOA、COL1A1、MCM4、DGCR5、ATG9B)在癌症和正常组织中的表达情况(图9)。最终可以得出基因FGF2、CCNB1、ALDOA、COL1A1、MCM4、DGCR5、ATG9B可以作为肺腺癌治疗的独立预后因子。

图6 ceRNA网络和PPI网络的构建

图7 对6个与风险评分相关的lncRNA和9个核心基因进行相关性分析

图8 基因表达水平对肺腺癌患者总生存时间的影响

图9 lncRNA-mRNA关系对中基因在肺腺癌和正常样本的表达情况

近年来,肺癌是患病率和死亡率明显增加的一种恶性肿瘤[30],非小细胞肺癌又是肺癌的主要类型之一,占所有病例约85%,而肺腺癌在非小细胞肺癌中的占比最高,约40%[31]。虽然手术切除可以一定程度上改善早期肺癌患者,但是其它原因会导致肺癌复发或转移。因此进一步了解肺癌的发生和发展机制是发现新的治疗手段的重要环节。随着高通量测序技术的发展,揭示了lncRNA在众多生物学过程中发挥着重要的调控作用。越来越多的证据表明,lncRNA在ceRNA网络中发挥重要作用,并且ceRNA网络中的靶基因对于肺癌患者的预后及耐药性的治疗可能具有重要作用[32-34]。本研究发现6个lncRNA中有一个是以前没有报道过的(FGF14-IT1),有5个是以前已经报道 过 的(DGCR5、LINC00536、ATG9B、ANO1-AS2、SYNPR-AS1)。其中DGCR5、SYNPR-AS1是已报道并与肺癌相关的lncRNA,而LINC00536、ATG9B、ANO1-AS2是与肺癌不相关,但与其它癌症紧密相关的lncRNA。DGCR5是一种人们比较了解的致癌因子之一,它通过竞争性结合miR-218-5p促进肺癌的迁移与侵袭[35]。这种lncRNA已被证明可以参与其他类型的肿瘤细胞的形成、增殖和转移,包括宫颈癌[36]、胰腺癌[37]、胆囊癌[38]和肝癌[39-40],在这些肿瘤类型中,它与患者较差的预后密切相关。LINC00536可以作为膀胱癌[41]、乳腺癌[42-43]和卵巢癌[44]等癌症的生物标志物以及在其中具有预后作用。ATG9B被证实在肾细胞癌[45]、肝细胞癌[46]、乳腺癌[47]的增殖和迁移的发展中发挥重要作用。SYNPR-AS1也被验证在肺癌的发展中发挥重要的作用[48]。因此,我们的ceRNA网络既能够成功识别先前验证过的肺腺癌相关的lncRNA,如DGCR5、SYNPR-AS1,又能够识别先前报道极少的FGF14-IT1。进一步分析还发现与6个lncRNA相关的核心基因(CCNB1、ALDOA、COL1A1、MCM4)也参与了肿瘤的发生与发展[49-52]。

综上所述,我们利用不同疾病分期的肺腺癌患者的组织样本数据生成一个包含lncRNAmiRNA-mRNA关系对的ceRNA网络。这个全面的网络不仅有利于对肺腺癌的基础机制的研究,也突出了对未来诊断和治疗的潜在靶点研究,强调了将lncRNA作为肺腺癌患者预后和治疗潜在生物标志物的价值。由于以往构建肺腺癌相关lncRNA网络的研究较少,因此我们的研究存在一定的局限性。值得注意的是,我们通过分析4个核心基因的存活率,间接地对6个lncRNA生存率进行了外部验证。此外在风险评分模型中,6个lncRNA的机制作用还没有被直接验证。因此,还需要进一步的工作来验证和扩大我们的发现。

猜你喜欢 腺癌肺癌样本 云南地区多结节肺腺癌EGFR突变及其临床意义昆明医科大学学报(2022年2期)2022-03-29氩氦刀冷冻治疗肺癌80例的临床观察中国药学药品知识仓库(2022年1期)2022-03-23十二指肠腺癌88例临床特征及相关预后因素昆明医科大学学报(2022年1期)2022-02-28以盆腔巨大包块就诊的宫颈微偏腺癌2例报告现代临床医学(2021年6期)2021-11-20长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达昆明医科大学学报(2021年4期)2021-07-23CXCL-14在非小细胞肺癌中的表达水平及临床意义天津医科大学学报(2021年2期)2021-03-29规划·样本领导决策信息(2018年16期)2018-09-27随机微分方程的样本Lyapunov二次型估计数学学习与研究(2017年3期)2017-03-09microRNA-205在人非小细胞肺癌中的表达及临床意义医学研究杂志(2015年12期)2015-06-10术后抗幽门螺杆菌治疗对Ⅲ期贲门腺癌预后的研究癌症进展(2015年2期)2015-03-11

推荐访问:预后 腺癌 竞争性

相关文章:

Top