侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

使用DriverPower識(shí)別癌癥driver基因的綜合負(fù)荷和功能影響測(cè)試

2020-12-24 14:21
科研菌
關(guān)注

3.候選driver event的發(fā)現(xiàn)

作者根據(jù)可供參考的driver元件集和其他六個(gè)已發(fā)布方法的候選driver程序?qū)ψ髡叩姆治鼋Y(jié)果進(jìn)行了基準(zhǔn)測(cè)試。

其中,使用三個(gè)參考driver元件集為:COSMIC癌癥基因普查(CGC),PCAWG原始綜合driver候選(PCAWG-raw),和PCAWG-consensus driver候選(PCAWG-consensus)。另外,六種已發(fā)布的方法中,ExInAtor20,ncdDetect21和LARVA22僅使用突變負(fù)荷信息。oncodriveFML23僅使用功能偏差;而MutSig24和ActiveDriverWGS25既可以對(duì)突變負(fù)荷也能通過(guò)功能校正進(jìn)行建模,但不能通過(guò)功能影響評(píng)分來(lái)建模。

CGC是driver的目錄,其突變與癌癥有關(guān)聯(lián),是編碼和剪接位點(diǎn)驅(qū)動(dòng)的金標(biāo)準(zhǔn)集(即用于計(jì)算精確度和召回率)。

PCAWG-raw是driver元件的集成,該驅(qū)動(dòng)程序元件由12種不同的驅(qū)動(dòng)程序檢測(cè)方法對(duì)作者在此使用的同一數(shù)據(jù)調(diào)用。

PCAWG-concensus是一個(gè)保守的集合,它衍生自PCAWG-raw,但通過(guò)應(yīng)用多個(gè)嚴(yán)格的過(guò)濾器來(lái)控制錯(cuò)誤發(fā)現(xiàn)率。

作者在DriverPower結(jié)果中觀察到了經(jīng)過(guò)良好校準(zhǔn)的p值(圖3d),并且編碼和非編碼driver發(fā)現(xiàn)的準(zhǔn)確性都很高(圖3e)。

圖3.泛癌隊(duì)列以及由三個(gè)參考驅(qū)動(dòng)程序集(CGC,PCAWG-concensus或PCAWG-raw)中包含的DriverPower調(diào)用的非編碼driver候選的數(shù)量和分?jǐn)?shù)

對(duì)于蛋白質(zhì)編碼區(qū)(CDS),作者利用DriverPower發(fā)現(xiàn)了217個(gè)顯著的(q <0.1)候選驅(qū)動(dòng)程序。少數(shù)基因(例如TP53)可以在多個(gè)隊(duì)列中作為driver基因。而且作者發(fā)現(xiàn)功能信息的合并提高了編碼driver發(fā)現(xiàn)的準(zhǔn)確性(圖 4a)。例如,在胰腺導(dǎo)管腺癌(Panc-AdenoCA; N?= 232),增加“功能調(diào)整”后的算法能挖掘到三個(gè)額外的driver(ACVR1B,RBM10和ZFP36L2)(圖4a)。而如果不合并功能信息,則CGC和CGC / PCAWG挖掘到的driver基因的整體精度均會(huì)下降。

圖4.合并功能信息后挖掘到三個(gè)額外的driver         均使用相同26個(gè)非黑素瘤/淋巴瘤隊(duì)列和CGC作為金標(biāo)準(zhǔn)集的情況下,DriverPower與其他六種方法進(jìn)行比較時(shí),DriverPower(精度= 0.84;召回率= 0.79)的F1分?jǐn)?shù)最高(0.81)(圖5b-c)。

F1分?jǐn)?shù)(F1 Score),是統(tǒng)計(jì)學(xué)中用來(lái)衡量二分類模型精確度的一種指標(biāo)。它同時(shí)兼顧了分類模型的精確率和召回率。F1分?jǐn)?shù)可以看作是模型精確率和召回率的調(diào)和平均,最大值為1,最小值為0。

圖5.DriverPower與其他六種方法F1得分比較

4.對(duì)DriverPower發(fā)現(xiàn)driver性能進(jìn)行基準(zhǔn)測(cè)試

接下來(lái),作者對(duì)DriverPower在非編碼driver event挖掘的準(zhǔn)確性進(jìn)行基準(zhǔn)測(cè)試。在剪接位點(diǎn)driver的識(shí)別上,DriverPower(F1 = 0.91)也優(yōu)于對(duì)比的兩種方法:ncdDetect(F1 = 0.65)和oncoDriverFML(F1 = 0.32)(圖6)。

圖6.預(yù)測(cè)影響編碼基因剪接位點(diǎn)的driver

進(jìn)一步,為了預(yù)測(cè)3'-UTR,5'-UTR,啟動(dòng)子和增強(qiáng)子中的非編碼driver,DriverPower在非黑素瘤/淋巴瘤腫瘤隊(duì)列中確定了19個(gè)候選,在泛癌隊(duì)列中確定了24個(gè)候選。基準(zhǔn)測(cè)試結(jié)果顯示,DriverPower在所評(píng)估的六種方法中同樣具有最高的F1分?jǐn)?shù)(0.79)(圖 7d-e)。

圖7.預(yù)測(cè)3'-UTR,5'-UTR,啟動(dòng)子和增強(qiáng)子中的非編碼driver

5.DriverPower也適用于WES

為了展示DriverPower的魯棒性,作者將DriverPower應(yīng)用于兩個(gè)公共全外顯子測(cè)序(WES)數(shù)據(jù)集(圖8)。這兩個(gè)WES數(shù)據(jù)集的處理方式與PCAWG數(shù)據(jù)不同,并且包含PCAWG研究中未包括的樣本。對(duì)于肝癌,DriverPower從TCGA-LIHC樣本(N=364)中識(shí)別出14個(gè)編碼driver。而在CGC或PCAWG-concensus中,除一個(gè)driver丟失外,所有候選driver都存在。

而對(duì)于胰腺腺癌,DriverPower從TCGA-PAAD樣本(N=180)(與PCAWG研究中沒(méi)有共享的樣本)中識(shí)別出六個(gè)編碼driver,并且全部對(duì)應(yīng)于已知的驅(qū)動(dòng)器基因(100%)。

圖8. WES的driver識(shí)別

本篇文章報(bào)告了DriverPower,這是一個(gè)通過(guò)合并突變負(fù)荷和功能影響信息來(lái)準(zhǔn)確識(shí)別驅(qū)動(dòng)和乘客突變的新框架。該方法利用了WGS技術(shù)產(chǎn)生的大型體細(xì)胞突變集,借助一千多個(gè)基因組特征構(gòu)建了準(zhǔn)確的全局BMR模型,與使用選定區(qū)域或側(cè)翼區(qū)域構(gòu)建本地BMR模型的方法形成對(duì)比。其優(yōu)點(diǎn)之一是該方法不偏向于編碼區(qū),而是在編碼和非編碼區(qū)都使用相同的模型挖掘癌癥driver。該方法的另一個(gè)優(yōu)點(diǎn)是高度模塊化。DriverPower可以與其他類型的基因組元素(編碼的或非編碼的)、用于建模BMR的其他回歸算法以及其他功能影響評(píng)分方案一起使用。此外,盡管DriverPower是為WGS項(xiàng)目設(shè)計(jì)的,但它在WES策略中也表現(xiàn)出色。

<上一頁(yè)  1  2  3  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)