憑借cw2vec方法,阿里健康拿下中文電子病歷實體識別全國冠軍
全國知識圖譜與語義計算大會(CCKS2018)8月14日至17日在天津舉行,憑借出色的專業(yè)能力,阿里健康團隊在中文電子病歷命名實體識別評測任務中奪冠。
電子病歷結(jié)構(gòu)化是讓計算機理解病歷、應用病歷的基礎(chǔ);趯Σv的結(jié)構(gòu)化,可以計算出癥狀、疾病、藥品、檢查檢驗等多個知識點之間的關(guān)系及其概率,構(gòu)建醫(yī)療領(lǐng)域的知識圖譜,進一步優(yōu)化醫(yī)生的工作。
例如,基于大醫(yī)院的優(yōu)質(zhì)病歷數(shù)據(jù)訓練的輔助診療系統(tǒng),可以在基層醫(yī)院應用以提升醫(yī)生的業(yè)務能力;根據(jù)癥狀和以往病歷記錄自動分析醫(yī)生開出的藥品是否合理,預測發(fā)生誤診的概率等等。結(jié)構(gòu)化的電子病歷對于臨床醫(yī)學科研等工作也具有重大作用,醫(yī)生可以更加智能地搜索相關(guān)病歷,或者查看相似病歷,也可以對病歷進行相關(guān)統(tǒng)計分析,有助于醫(yī)生發(fā)現(xiàn)潛在的知識聯(lián)系,產(chǎn)生高水平的臨床研究論文。
此次CCKS2018的電子病歷命名實體識別的評測任務,是對于給定的一組電子病歷純文本文檔,識別并抽取出其中與醫(yī)學臨床相關(guān)的實體,并將它們歸類到預先定義好的類別中。組委會針對這個評測任務,提供了600份標注好的電子病歷文本,共需識別含解剖部位、獨立癥狀、癥狀描述、手術(shù)和藥物五類實體。
目前主流的中文實體識別方法主要沿用自英文和其他語言的通用方法,并沒有把中文的特色發(fā)揮出來。而正如英文中可以根據(jù)單詞的詞根詞綴來猜測其意義和性質(zhì)一樣,漢字的筆畫及偏旁部首中也蘊含著大量信息。阿里健康團隊以兩種序列標注算法為基礎(chǔ),首次在醫(yī)療文本領(lǐng)域采用了cw2vec的方法構(gòu)建詞向量矩陣,基于全部的非標注文本和標注文本集訓練詞向量,以解決新字無法識別的問題;同時改進了漢字結(jié)構(gòu)和拼音的特征的一般方案。最終,團隊以嚴格指標0.8913取得了第一名的好成績。
“醫(yī)療命名實體識別只是我們團隊工作的一小部分,也是我們面向醫(yī)院和醫(yī)生提供醫(yī)療人工智能服務的基礎(chǔ)。”阿里健康人工智能實驗室主任范繹說,阿里健康團隊長期專注通過實體識別、實體鏈接、關(guān)系提取等手段從電子病歷中識別信息,并在此基礎(chǔ)上對信息進行融合和整合,以知識圖譜的呈現(xiàn)形式,為其他服務提供數(shù)據(jù)基礎(chǔ)。在此之上,基于電子病歷數(shù)據(jù),阿里健康打造了大數(shù)據(jù)科研平臺、臨床輔助決策引擎等針對醫(yī)院和醫(yī)生的多款產(chǎn)品,為廣大醫(yī)生和用戶提供更加智能的用戶體驗,幫助其提升專業(yè)水平和工作效率。
CCKS是由中國中文信息學會語言與知識計算專業(yè)委員會(CIPS)定期舉辦的全國年度學術(shù)會議,致力于促進中國語言與知識計算領(lǐng)域的學術(shù)研究和產(chǎn)業(yè)發(fā)展,為從事相關(guān)領(lǐng)域理論和應用研究的學者、機構(gòu)和企業(yè)提供廣泛交流的平臺,已經(jīng)成為國內(nèi)知識圖譜、語義技術(shù)、語言理解和知識計算等領(lǐng)域的核心會議。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
11月19日立即報名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
11月25日立即預約>> 【上海線下】設(shè)計,易如反掌—Creo 11發(fā)布巡展
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟產(chǎn)業(yè)大會暨展覽會
-
精彩回顧立即查看>> 全數(shù)會2024中國人形機器人技術(shù)創(chuàng)新發(fā)展大會
-
精彩回顧立即查看>> OFweek 2024中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會
-
10 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市