摘要:
目的·从转录组层面探究影响高度微卫星不稳定(microsatellite instability-high,MSI-H)结直肠癌转移的潜在关键基因及基因表达特征,并构建基因转移预测模型。方法·从癌症基因组图谱数据库中收集MSI-H结直肠癌患者转录组数据,根据转移信息分为转移组(21例)和无转移组(42例),分析2组间差异表达基因(differentially expressed gene,DEG),以基因本体数据库(Gene Ontology,GO)、基因集富集分析(Gene Set Enrichment Analysis,GSEA)对DEG进行注释、聚类及信号通路富集;使用STRING、Cytoscape软件筛选枢纽基因(hub基因);选取DEG绘制列线图,使用Bootstrap方法进行交叉验证;分析列线图中每个基因对MSI-H结直肠癌无进展生存期(progression-free survival,PFS)的影响。结果·转移组和无转移组间共得到245个DEGs,其中转移组较无转移组表达上调基因204个,下调基因41个。GO分析发现:DEG在生物过程、分子功能上主要富集于离子穿膜转运、氯离子穿膜转运及氯离子通道活性;在细胞组分中,富集于细胞外部分、细胞外空间等。GSEA结果显示:上调基因富集于神经活性物质配体-受体相互作用和代谢信号通路。通过Cytoscape筛选出上调基因蛋白质互作网络中的前10位的hub基因。根据DEG中调整后P值最小且与肿瘤发生发展关联性高的前10个基因构建的转移预测模型有一定的预测效能,其中训练集曲线下面积(area under curve,AUC)=0.975,验证集AUC=0.920;模型中AC078993.1、IGLJ2 (immunoglobulin lambda joining 2)的表达水平与MSI-H结直肠癌PFS呈明显负相关(P=0.011,P=0.005)。结论·在MSI-H结直肠癌中,离子通道变化及细胞外环境变化可能对肿瘤转移有重要影响,神经活性物质配体-受体相互作用、代谢信号通路可能是对转移较重要的信号通路;初步构建了MSI-H结直肠癌基因转移预测模型,可为后续相关临床研究提供参考。