侵權投訴
訂閱
糾錯
加入自媒體

利用Cox回歸尋找治療靶點的5+分思路

2020-12-17 17:30
科研菌
關注

\大家好,今天和大家分享的是2020年8月發(fā)表在journal of cellular physiology(IF=5.546)上的一篇文章:“Prognostic scoring system for osteosarcoma using network-regularized high-dimensional Cox-regression analysis and potential therapeutic targets”;趍RNA的表達數(shù)據(jù)和臨床數(shù)據(jù),作者開發(fā)了一種新的骨肉瘤患者預后評分系統(tǒng)。使用網(wǎng)絡正則化高維Cox回歸(network‐regularized high‐dimensional Cox regression,NET)分析mRNA的表達數(shù)據(jù),根據(jù)回歸系數(shù)和mRNA表達值確定預后風險評分,利用The Connectivity Map(CMap)預測骨肉瘤的治療靶點。

Prognostic scoring system for osteosarcoma using network‐regularized high‐dimensional Cox‐regression analysis and potential therapeutic targets

基于網(wǎng)絡正則化高維Cox回歸分析的骨肉瘤預后評分系統(tǒng)及潛在治療靶點

一、研究背景

骨肉瘤是一種可以產(chǎn)生惡性骨樣物質且具有高死亡率的腫瘤,它在青少年中最常見。在過去的二十年中,骨肉瘤患者的生存率沒有明顯改善。隨著個性化和精確化醫(yī)學的發(fā)展,對患者的基因進行研究,以確定新的治療靶點是目前的研究趨勢。為了識別基因組數(shù)據(jù)中預后相關的變量,統(tǒng)計學家開發(fā)了許多新的分組變量的選擇方法,如網(wǎng)絡正則化高維Cox回歸(network‐regularized high‐dimensional Cox regression, NET)分析。

二、分析流程

三、結果解讀
1.預后評分系統(tǒng)

作者從GEO數(shù)據(jù)庫下載了包含53例高級別骨肉瘤患者的mRNA表達數(shù)據(jù)和臨床信息的數(shù)據(jù)集(GSE21257),其中34例來自5年內發(fā)生轉移的患者,其余19例來自未發(fā)生轉移的患者;颊咛卣骺偨Y在表1中。

表1.骨肉瘤患者具體信息和風險分組

       作者使用Coxnet包對骨髓瘤患者基因表達數(shù)據(jù)進行網(wǎng)絡正則化高維cox回歸分析( network‐regularized high‐dimensional Cox regression, NET),評估OS和mRNA表達值之間的關系。

為了獲得更有意義的結果,需要一些額外的參數(shù)。作者從六個大型數(shù)據(jù)庫(Biocarta, HumanCyc, KEGG, NCI, Panther, Reactome)獲取數(shù)據(jù),使用graphite包構建了基因-基因通路矩陣作為正則化參數(shù)Ω。使用留一法進行NET分析來進行交叉驗證,根據(jù)最小交叉驗證誤差確定混合參數(shù)α,該參數(shù)決定L1范數(shù)和L2范數(shù)的平衡。當α的值為1時,19個基因被選擇;當α值為0.1時,148個基因被選擇,圖1和表2描述了根據(jù)α值選擇的基因數(shù)量和預后意義。圖1中橫坐標為α值,縱坐標C-index是評價模型預測能力的一個指標(C-index大于0.75表示模型對OS具有優(yōu)秀的預測能力),結果顯示α的值為1和0.1時的對OS都有非常好的預測能力,考慮到其效率,最佳α值為1。預后風險評分為基因的表達水平與相應的回歸系數(shù)的乘積之和。

表2.α值為1時的19個被選基因

圖1.不同α值對應的變量數(shù)量和C-index

2.風險分層系統(tǒng)

基于預測評分系統(tǒng),作者構建了風險分層系統(tǒng)對患者的預后進行預測。通過五折交叉驗證根據(jù)c指數(shù)的大小確定風險分界值,所有患者的風險評分介于9.740和6.618之間,最佳的風險分界值為8.518559,樣本被分為高風險和低風險兩組(高風險:20,低風險:33;表1),兩組之間包括年齡、性別和組織學等級在內的臨床信息沒有顯著差異(表1)。

在應用最佳α值1時,高風險組和低風險組的OS具有顯著差異(p < 0.0001,圖2)。并且,預后評分系統(tǒng)系統(tǒng)獲得了較高的c指數(shù)(0.967),而年齡和性別等其他變量則獲得了較低的c指數(shù),這證明風險分層系統(tǒng)在預測高級別骨肉瘤預后方面非常準確。

圖2.高風險組和低風險組生存分析(OS)

如圖3c所示,進行時間依賴性ROC曲線分析,AUC值為0.953~1.000,表示風險分層系統(tǒng)OS對具有優(yōu)秀的預測能力。此外,作者還根據(jù)組織學分級將樣本分為兩個亞組(圖4d為組織學1、2級的亞組,圖4e為組織學3、4級的亞組),進行了生存分析,結果表明,在不同組織學分級的亞組中,高風險組和低風險組的OS同樣具有顯著差異。

圖3.風險分層系統(tǒng)預測不同生存時間的ROC曲線

圖4.按照組織學分級的亞組分析

經(jīng)單因素Cox回歸分析發(fā)現(xiàn),GSE21257中的臨床變量(年齡、性別和年級)與預后無顯著相關性(表3),多因素Cox回歸分析也得到了相似的結果。

表3.Cox回歸分析

3.骨肉瘤治療靶點的預測

作者使用The Connectivity Map(CMap)預測骨肉瘤的治療藥物和治療靶點。CMap是由Broad研究所開發(fā)的一個基于干預基因表達的基因表達譜數(shù)據(jù)庫,主要用于揭示小分子化合物,基因和疾病狀態(tài)的功能聯(lián)系。

在預后評分系統(tǒng)中,風險得分高表示預后較差,而風險得分低表示預后較好。按照此標準,表示良好預后的基因信號應為:具有正回歸系數(shù)的基因下調,具有負回歸系數(shù)的基因上調。將α值為0.1時選擇的148個基因分為正和負回歸系數(shù)組,將正回歸系數(shù)組作為下調基因,負回歸系數(shù)組作為上調基因輸入到CMap程序。結果顯示,BACE2、IN2、RBBP6、 SNX2等基因敲除或下調,linifanib和APEX抑制劑等藥物的使用,可以改善骨肉瘤患者的預后;而SCAP、PREEN、KBTBD、 ZNF114基因敲除或下調,糖原合成酶抑制劑SB‐216763的使用,可能會導致預后變差(圖4)。

圖5.Connectivity Map分析結果

小結

      基于從GEO數(shù)據(jù)庫中獲取的mRNA的表達數(shù)據(jù)和臨床數(shù)據(jù),作者開發(fā)一種新的骨肉瘤患者預后評分系統(tǒng)。對mRNA的表達數(shù)據(jù)進行NET分析確定回歸系數(shù),正則化系數(shù)Ω和混合系數(shù)α使分析結果更有意義。風險評分為基因的表達水平與相應的回歸系數(shù)的乘積,通過五折交叉驗證和c指數(shù)確定風險分界值,時間依賴性ROC曲線分析和亞組分析用于檢驗該系統(tǒng)的預測能力。使用The Connectivity Map(CMap)預測骨肉瘤的治療藥物和治療靶點。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號