侵權(quán)投訴
訂閱
糾錯
加入自媒體

缺乏訓(xùn)練樣本醫(yī)療AI“喂不飽”?騰訊優(yōu)圖實驗室想了這兩個辦法

2019-06-04 17:15
來源: 粵訊

“醫(yī)學(xué)影像本質(zhì)上是一個圖像識別問題,面臨的最大挑戰(zhàn)是小樣本學(xué)習(xí)的問題!

5月30日-6月2日,由中國醫(yī)師協(xié)會、中國醫(yī)師協(xié)會放射醫(yī)師分會主辦,廣東省人民醫(yī)院及廣東省醫(yī)師協(xié)會放射醫(yī)師分會承辦的“中國醫(yī)師協(xié)會第十三次放射醫(yī)師年會”在廣州召開,這也是中國放射學(xué)界最高級別的會議之一,影像組學(xué)與醫(yī)學(xué)影像人工智能領(lǐng)域的跨界融合是這次會議的重要議題之一。

騰訊優(yōu)圖實驗室醫(yī)療AI總監(jiān)鄭冶楓博士受邀出席,并進行題為“深度學(xué)習(xí)在醫(yī)學(xué)影像分析上的應(yīng)用”的主題分享,分享優(yōu)圖實驗室通過遷移學(xué)習(xí)和計算機合成圖像兩大方法,突破醫(yī)療AI數(shù)據(jù)量不足,沒有辦法像傳統(tǒng)機器學(xué)習(xí)那樣用大數(shù)據(jù)進行喂哺的問題。

image.png

鄭冶楓博士在中國醫(yī)師協(xié)會第十三次放射醫(yī)師年會上做主題演講

騰訊優(yōu)圖實驗室是騰訊頂級人工智能實驗室之一,專注于在人臉、圖像、視頻、醫(yī)療影像等領(lǐng)域開展技術(shù)研究。騰訊首款將人工智能技術(shù)運用在醫(yī)學(xué)領(lǐng)域的產(chǎn)品“騰訊覓影”,即是由騰訊醫(yī)療健康事業(yè)部牽頭,優(yōu)圖實驗室提供的算法支持。

醫(yī)療AI面臨“雙重挑戰(zhàn)”

當前人工智能技術(shù)的迅猛發(fā)展,與強大的計算能力、合理的優(yōu)化算法和高質(zhì)量的大數(shù)據(jù)密切相關(guān)。要讓機器像人類那樣思考,成為醫(yī)生的得力助手,就必須“喂”給它大量的數(shù)據(jù),幫助它從中找出規(guī)律。但是,在醫(yī)療人工智能領(lǐng)域,這一切卻沒有這么簡單。鄭冶楓博士提到,近年來,深度學(xué)習(xí)在包括圖像識別、游戲、語音識別、自然語言處理等方面取得了重大發(fā)展。但是,醫(yī)療AI的發(fā)展卻面臨“雙重挑戰(zhàn)”。

一是缺乏訓(xùn)練樣本。鄭冶楓博士表示,“深度學(xué)習(xí)的目標是盡量端對端,圖像進去、結(jié)果出來,因而網(wǎng)絡(luò)越來越大,越來越多層,需要的訓(xùn)練樣本也越來越多。”但與自然場景下自然圖像獲取不同,醫(yī)學(xué)影像的獲取十分艱難。一方面,患者對于個人的就醫(yī)隱私要更為重視,醫(yī)學(xué)圖像幾乎不會上網(wǎng)和共享;另一方面,圖像采集的“高門檻性”也制約著訓(xùn)練樣本的獲取。“醫(yī)學(xué)影像采集需要專門的設(shè)備,有一些設(shè)備非常昂貴,比如CT和核磁。”同時,疾病本身的特殊性也對算法工程師獲取樣本造成阻礙,鄭冶楓博士表示,“對于一些罕見病種,能夠找到的圖像就只有幾百張或者一千來張,因為每年的發(fā)病量就那么多!

二是缺乏標注。鄭冶楓博士介紹道,對于自然圖像來講,其標定相對容易,即便是普通人也能夠直接標注。但醫(yī)學(xué)影像不同,其標注需要行業(yè)頂尖的專業(yè)醫(yī)生參與!艾F(xiàn)實是,培養(yǎng)一個醫(yī)生需要十年時間甚至很長,加上臨床、科研任務(wù)重,做數(shù)據(jù)標注對于醫(yī)生來說也是‘有心無力’!

兩大方法突破醫(yī)療AI小樣本學(xué)習(xí)問題

缺乏訓(xùn)練樣本、缺乏標注這兩大挑戰(zhàn)讓深度學(xué)習(xí)“彈藥不足”,由此衍生出的“小樣本學(xué)習(xí)”問題一定程度上阻礙了AI醫(yī)學(xué)影像的發(fā)展。鄭冶楓博士提出,有兩種方法有助于解決這一問題:一是遷移學(xué)習(xí);二是計算機合成圖像,比如生成對抗網(wǎng)絡(luò)。

在介紹遷移學(xué)習(xí)的概念時,鄭冶楓博士用了一個生動的比喻:“比如說一個人去森林里找老虎,但從來沒有見過老虎,不知道老虎長什么樣。但假如他可以把貓和狗、狐貍等其他動物區(qū)分開來,就可以先訓(xùn)練他去找貓,這就是預(yù)訓(xùn)練的過程。接下去,我們告訴對方:老虎就是黃色的貓放大100倍,從而達到‘找老虎’這個目的!彼麖娬{(diào),遷移學(xué)習(xí)非常適用于解決小樣本的訓(xùn)練問題。

另一個方法則是計算機合成圖像。鄭冶楓博士表示,通過影像跨模態(tài)轉(zhuǎn)換,計算機合成圖像能夠有效補充訓(xùn)練樣本,而生成對抗網(wǎng)絡(luò)則讓訓(xùn)練如虎添翼:一個網(wǎng)絡(luò)生成圖像,一個網(wǎng)絡(luò)鑒別目標的真?zhèn),把兩個網(wǎng)絡(luò)做一些聯(lián)合訓(xùn)練。訓(xùn)練結(jié)束時,生成網(wǎng)絡(luò)可以產(chǎn)生非常逼真的圖像。鄭冶楓博士以肝癌為例,“有時候跨模態(tài)生成的圖像會扭曲,會生成一些新的病灶,也可能遺漏一些病灶,為此,我們在研究過程中會加上各類限制,減少生成圖像的失真。我們的算法很完美地保留了器官和病灶的形狀,是在用非常真實的圖像作為訓(xùn)練任務(wù),通過這種方法,能夠讓準確率得到明顯的提升!

image.png

“騰訊覓影”能精確定位3mm以上的微小肺結(jié)節(jié),檢出率≥95%

醫(yī)療AI逐步落地 提升診斷準確率和效率

通過遷移學(xué)習(xí)、計算機合成圖像等方法,影像診斷領(lǐng)域的深度學(xué)習(xí)取得了顯著進展。以肺結(jié)節(jié)檢測為例,鄭冶楓博士介紹道,目前肺結(jié)節(jié)檢查方式主要是肺部CT,隨著薄層低劑量CT的應(yīng)用,圖像數(shù)量的倍增、小結(jié)節(jié)顯示率的提高及結(jié)節(jié)的定量測量等使得讀片的難度顯著增加,同時,繁重、枯燥的閱片工作使影像科醫(yī)師的疲勞度增加,漏診、誤診的風(fēng)險也在增加。

人工智能的運用,使得這些問題逐步得到解決。經(jīng)過不斷地迭代和更新,“騰訊覓影”早期肺癌篩查AI系統(tǒng)采用了騰訊優(yōu)圖實驗室的“端到端肺癌輔助診斷技術(shù)”,能夠精準定位微小結(jié)節(jié)位置和輔助醫(yī)生準確判斷患者患有肺癌的風(fēng)險。預(yù)處理模塊、檢測與識別模塊是這一系統(tǒng)的核心算法。前者利用肺部的三維分割和重建算法,可以處理不同CT成像設(shè)備在不同成像參數(shù)條件下產(chǎn)生的不同源數(shù)據(jù)。而后者采用了“深度學(xué)習(xí)領(lǐng)域最好的分割算法”——全卷積神經(jīng)網(wǎng)絡(luò),可以實現(xiàn)早期肺結(jié)節(jié)檢測和分割。鄭冶楓博士表示,全卷積神經(jīng)網(wǎng)絡(luò)有兩部分,一部分是編碼器,把圖像不斷卷積和下采樣,最后壓縮到低維空間,這是不同任務(wù)可以共享的。一部分是解碼器,不斷卷積和上采樣,最后輸出一個輸入圖像大小一樣的分割結(jié)果,這部分是每個任務(wù)獨有的。我們預(yù)訓(xùn)練的編碼器會把所有任務(wù)的圖像都看一遍,因此訓(xùn)練得非常好。”

“把編碼器訓(xùn)練好之后,就將其遷移到其它任務(wù),如肺部分割和肺結(jié)節(jié)良惡性判斷上。采用公開數(shù)據(jù)集,發(fā)現(xiàn)不僅僅分割可以做得很好,分類也可以做得很好!编嵰睏鞑┦繌娬{(diào),“在醫(yī)療AI上,技術(shù)方面大部分工作都差不多,最后的競爭還是在細節(jié)方面。比如在良惡性的判斷上,騰訊提出了Med3D預(yù)訓(xùn)練模型,該模型采用多個公開競賽數(shù)據(jù)集進行訓(xùn)練。通過選取三維醫(yī)學(xué)影像進行圖像分割任務(wù),并對這些數(shù)據(jù)進行抓取、收集,預(yù)訓(xùn)練一個模型,能夠大幅提高分割和分類的準確率,解決了大部分結(jié)節(jié)不活檢,不知道良惡性的問題!

據(jù)了解,目前,“騰訊覓影” 通過人工智能醫(yī)學(xué)圖像分析能力輔助醫(yī)生閱片,已經(jīng)能精確定位3mm以上的微小肺結(jié)節(jié),檢出率≥95%。同時,除早期肺癌外,“騰訊覓影”還能利用AI醫(yī)學(xué)影像分析輔助臨床醫(yī)生篩查早期食管癌、眼底疾病、結(jié)直腸腫瘤、宮頸癌、乳腺腫瘤等疾病。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號