肿瘤康复网,内容丰富有趣,生活中的好帮手!
肿瘤康复网 > 发文——踩好点 选好数据很重要

发文——踩好点 选好数据很重要

时间:2023-07-21 05:03:11

相关推荐

A 16‐mRNA signature optimizes recurrence‐free survivalprediction of Stages II and III gastric cancer16-mRNA特征有效预测胃癌Ⅱ期和Ⅲ期的无复发生存一、摘要:胃癌世界上最普遍的恶性肿瘤之一,尽管不断改进治疗方案,死亡率依旧在排在世界前列。临床诊断中,即使患者具有相同的TNM分期(tumor, lymph node, metastasis),可能基于肿瘤分子特征不一,生存情况也各不相同。因此,对评估术后复发风险的有效方法需求日益迫切。基于此,研究人员通过绝对收缩和选择算子的方法以及COX回归模型,在三个临床患者数据集内,开发了一个可以有效预测胃癌二、三期复发风险的工具,将有效提高临床诊断预后评估水平。二、材料方法:1、胃癌基因表达数据:本研究相关的胃癌数据全部来自于GEO (https://www.ncbi.nlm.nih.gov/geo/) 和TCGA (https://cancergenome.nih.gov/)。

2、16-mRNA特征挖掘及验证:通过使用R语言包“WGCNA” (weighted correlation network analysis)在实验数据集GSE62254中筛选到预后相关的680个基因,并通过“glmnet” package of R software 进行LASSO回归模型分析并验证16mRNA特征。

3、诺模图建立及评估:通过“rms”R包构建了诺模图和标定图,并通过“pROC”R包构建了ROC曲线以检测诺模图的准确性。4、数据分析:相关数据分析使用了t检验,ROC分析,GSVA,PEC,单变量以及多变量Cox回归分析等方法。三、结果1、研究人员首先对实验数据集GSE62254进行Cox回归分析,确定与胃癌二、三期RFS(relapse‐free survival,RFS)相关的680个基因。随后,对这些基因进一步采用最小绝对收缩和选择算子的LASSOCOX回归分析(fig1a,b)。

图1. LASSOCOX回归分析胃癌二期三期相关的680个RFS基因2、Kaplan-Meier生存曲线中位风险评分为临界值,将患者分为低风险组或高危组,结果表明,与低风险组相比,高危组预后较差,此结论在另外两个独立的数据集GSE26253和TCGA中也得到了一致验证。

图2. Kaplan-Meier生存曲线中位风险评分为临界值,将患者分为低风险组或高危组。3、以风险评分、肿瘤分期、年龄和性别为协变量,采用单变量和多变量Cox回归分析,风险评分是二、三期GCS的独立危险因素。并且研究人员得到结论,三个数据集中风险评分均与RFS显着相关。

图3. 对三个数据集的风险评分、年龄、性别和肿瘤分期进行了单变量和多变量Cox回归分析4、研究人员为了将分析结果更适用于临床,在GSE62254数据集中构建了整合16-mRNA标记、肿瘤分期、Lauren分类、淋巴结比率和化疗为一体的诺模图(fig4a),同时,通过标定图证明诺模图的良好性能(fig4b),通过基于诺模图的ROC曲线证明其预测准确性(fig4c),AOC曲线分析证明使用诺模图预测5年复发率会更有利于临床治疗方案的设计(fig4d)。

图4. 诺模图数据集中预测复发风险的诺模图。5、研究人员为了寻找16-mRNA特征相关的基因集,对数据集GSE62254进行GSVA分析,发现高风险组中有许多转移和化疗耐药相关的基因组丰富(fig5a),并且16-mRNA特征标记与这些基因存在很强的正相性(fig5b)。

图5. 在数据集GSE62254中进行GSVA分析四、结论本文综合使用了绝对收缩和选择算子方法以及COX回归模型等经典的生信分析手段,挖掘到Ⅱ、Ⅲ期胃癌的新预后评估指标。在解决高维数据的处理方法中,此生信分析方法的综合使用不失为一张锦囊妙计。该研究没有做实验吧,图也很少,用的还都是公共数据库数据集

如果觉得《发文——踩好点 选好数据很重要》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。