“深度學習輔助決策醫(yī)療器械軟件審評要點”發(fā)布!AI要拿三類證,這幾點做好了嗎?
動脈網獲悉,2019年6月29日,國家藥品監(jiān)督管理局醫(yī)療器械技術審評中心發(fā)布了《深度學習輔助決策醫(yī)療器械軟件審批要點》,為相應醫(yī)療器械軟件注冊申報提供專業(yè)建議。(下簡稱《要點》)
據動脈網了解,《要點》主要由五部分組成:
一、適用范圍;
二、審批關注要點;
三、軟件更新;
四、相關技術考量;
五、注冊申報資料說明。
以下為動脈網整理的《要點》中的關鍵詞:
關鍵詞一:適用范圍
深度學習輔助決策醫(yī)療器械軟件即基于醫(yī)療器械數據(醫(yī)療器械所生成的醫(yī)學圖像、醫(yī)學數據,以下統(tǒng)稱數據),使用深度學習技術進行輔助決策的軟件。
使用深度學習技術進行前處理(如成像質量改善、成像速度提升、圖像重建)、流程優(yōu)化(如一鍵操作)、常規(guī)后處理(如圖像分割、數據測量)等非輔助決策的軟件可參考使用本審評要點。
這里以是否“輔助決策”對產品進行了劃分,強調了產品的“輔助”功能;同時,也明確表示非輔助決策軟件也將以類似手段進入審批流程。
關鍵詞二:審批重點
《要點》中提到,本審評要點重點關注軟件的數據質量控制、算法泛化能力、臨床使用風險,臨床使用風險應當考慮數據質量控制、算法泛化能力的直接影響,以及算力所用計算資源(即運行環(huán)境)失效的間接影響。
基于風險的全生命周期管理是此類軟件監(jiān)管的基本方法,軟件風險管理活動應當基于軟件的預期用途(目標疾病、臨床用途、重要程度、緊迫程度)、使用場景(適用人群、目標用戶、使用場所、臨床流程)、核心功能(處理對象、數據兼容性、功能類型)予以實施,并貫穿于軟件全生命周期過程。
軟件臨床使用風險主要包括假陰性和假陽性,其中假陰性即漏診,可能導致后續(xù)診療活動延誤,特別是要考慮快速進展疾病的診療活動延誤風險;假陽性即誤診,可能導致后續(xù)不必要的診療活動。
進口軟件除考慮假陽性和假陰性風險外,還應當考慮中外人種、流行病學特征、臨床診療規(guī)范等方面差異的影響及其風險。生產企業(yè)應當采取充分的、適宜的、有效的風險控制措施以保證軟件的安全性和有效性。
關鍵詞三:數據來源
《要點》中提到,數據收集應當考慮數據采集、數據預處理、數據標注、數據集構建等活動的質控要求,以保證數據質量和算法設計質量。此外,應當考慮采集設備、采集過程以及數據脫敏的質控要求;脫敏數據由臨床機構轉移至生產企業(yè)形成原始數據庫,不同模態(tài)的數據在原始數據庫中應當加以區(qū)分;數據標注應當考慮標注資源管理、標注過程質控、標注質量評估等要求。
關鍵詞四:算法設計
《要點》中提到,應當考慮算法選擇、算法訓練、網絡安全防護、算法性能評估等活動的質控要求。建議數據驅動與知識驅動相結合進行算法設計,以提升算法可解釋性。
在原文中,《要點》對具體算法的選擇、訓練方式、網絡安全都進行了明確的要求。
關鍵詞五:以臨床評價為主的軟件確認方式
根據軟件指導原則要求,軟件應當提交基于臨床試驗的臨床評價資料,即提交申報產品的臨床試驗資料,或者與申報產品核心算法具有實質等同性的同品種產品或同類軟件功能的臨床試驗資料。
進口軟件應當提供中外人種、流行病學特征、臨床診療規(guī)范等方面差異影響的臨床評價資料,若不足以證實申報產品在中國使用的安全性和有效性,應當在中國開展臨床試驗。使用境外臨床試驗數據應當滿足《接受醫(yī)療器械境外臨床試驗數據技術指導原則》要求。
而臨床試驗應當符合《醫(yī)療器械臨床試驗質量管理規(guī)范》要求。建議優(yōu)先選擇同品種產品或臨床參考標準(即臨床金標準)進行非劣效對照設計;建議臨床試驗結果由第三方獨立評價;臨床評價可采用基于現有歷史數據的回顧性研究。
關鍵詞六:注冊申報資料說明
《要點》中提到,申報的軟件名稱需符合獨立軟件通用名稱命名規(guī)范要求,體現處理對象(如CT圖像、眼底照片)、目標疾病(含病變、疾病屬性)、臨床用途(如輔助篩查、輔助識別)等特征詞。
輔助決策獨立軟件適用范圍應當明確預期用途、使用場景和核心功能,包括但不限于處理對象、目標疾病、臨床用途、適用人群、目標用戶、使用場所、采集設備要求、臨床使用限制。
企業(yè)必須提供:一、軟件描述文檔核心算法部分應當結合本審評要點提供相應算法研究資料;二、包括數據來源合規(guī)性聲明;三、算法性能影響因素分析資料以及各類測試場景下算法性能評估結果比較分析資料。
說明書應當符合《醫(yī)療器械說明書和標簽管理規(guī)定》要求。
除了上述六個關鍵點外,《要點》還明確了非輔助決策軟件、傳統(tǒng)人工智能軟件的要求以及第三方數據庫、移動與云計算等考量。在此之中提出了“前處理軟件功能原則上應當開展算法性能評估、臨床評價;流程優(yōu)化軟件功能開展算法性能評估即可,無需開展臨床評價;常規(guī)后處理軟件功能原則上開展算法性能評估即可,全新功能應當開展臨床評價”的評價要求。
以下為《深度學習輔助巨冊醫(yī)療器械軟件審批要點》全文。
一、適用范圍
本審評要點適用于深度學習輔助決策醫(yī)療器械軟件(含獨立軟件、軟件組件)的注冊申報。深度學習輔助決策醫(yī)療器械軟件(以下簡稱軟件)即基于醫(yī)療器械數據(醫(yī)療器械所生成的醫(yī)學圖像、醫(yī)學數據,以下統(tǒng)稱數據),使用深度學習技術進行輔助決策的軟件。其中,“基于醫(yī)療器械數據”是指單獨使用醫(yī)療器械數據,或者聯(lián)合使用醫(yī)療器械數據與非醫(yī)療器械數據;“輔助決策”是指通過提供診療活動建議輔助醫(yī)務人員進行臨床決策。
使用深度學習技術進行前處理(如成像質量改善、成像速度提升、圖像重建)、流程優(yōu)化(如一鍵操作)、常規(guī)后處理(如圖像分割、數據測量)等非輔助決策的軟件可參考使用本審評要點。使用傳統(tǒng)機器學習技術的軟件亦可參考使用本審評要點。
本審評要點遵循《醫(yī)療器械軟件注冊技術審查指導原則》(以下簡稱軟件指導原則)、《醫(yī)療器械網絡安全注冊技術審查指導原則》(以下簡稱網絡安全指導原則)、《移動醫(yī)療器械注冊技術審查指導原則》(以下簡稱移動器械指導原則)等相關指導原則要求。
本審評要點不含人工智能倫理、數據產權等法律法規(guī)層面要求,但生產企業(yè)應當在軟件全生命周期過程中考慮相關規(guī)定。
二、審評關注重點
從發(fā)展驅動要素角度講,深度學習實為基于海量數據和高算力的黑盒算法。本審評要點重點關注軟件的數據質量控制、算法泛化能力、臨床使用風險,臨床使用風險應當考慮數據質量控制、算法泛化能力的直接影響,以及算力所用計算資源(即運行環(huán)境)失效的間接影響。
基于風險的全生命周期管理是此類軟件監(jiān)管的基本方法,相關考量詳見軟件指導原則、網絡安全指導原則、移動器械指導原則以及醫(yī)療器械生產質量管理規(guī)范獨立軟件附錄。下面結合審評關注重點分別闡述軟件風險管理、軟件設計開發(fā)、軟件更新等方面考量。
軟件風險管理活動應當基于軟件的預期用途(目標疾病、臨床用途、重要程度、緊迫程度)、使用場景(適用人群、目標用戶、使用場所、臨床流程)、核心功能(處理對象、數據兼容性、功能類型)予以實施,并貫穿于軟件全生命周期過程。軟件臨床使用風險主要包括假陰性和假陽性,其中假陰性即漏診,可能導致后續(xù)診療活動延誤,特別是要考慮快速進展疾病的診療活動延誤風險;假陽性即誤診,可能導致后續(xù)不必要的診療活動。進口軟件除考慮假陽性和假陰性風險外,還應當考慮中外人種、流行病學特征、臨床診療規(guī)范等方面差異的影響及其風險。生產企業(yè)應當采取充分的、適宜的、有效的風險控制措施以保證軟件的安全性和有效性。
軟件典型設計開發(fā)過程通?煞譃樾枨蠓治、數據收集、算法設計、驗證與確認等階段。
1
需求分析
需求分析應當以軟件的臨床需求與使用風險為導向,結合軟件的預期用途、使用場景和核心功能,綜合考慮法規(guī)、標準、用戶、產品、數據、功能、性能、接口、用戶界面、網絡安全、警示提示等方面需求,重點考慮數據收集、算法性能、臨床使用限制等方面要求。
數據收集應當考慮數據來源的合規(guī)性和多樣性、目標疾病流行病學特征、數據質量控制要求(詳見下節(jié))。數據來源應當在合規(guī)性基礎上保證數據多樣性,以提高算法泛化能力,如盡可能來自多家、不同地域、不同層級的代表性臨床機構,盡可能來自多種、不同采集參數的采集設備。目標疾病流行病學特征包括但不限于疾病構成(如分型、分級、分期)、人群分布(如健康、患者,性別、年齡、職業(yè)、地域、生活方式)、統(tǒng)計指標(如發(fā)病率、患病率、治愈率、死亡率、生存率)等情況,以及目標疾病并發(fā)癥與類似疾病的影響情況。
算法性能應當考慮假陰性與假陽性(指標、關系)、重復性與再現性、魯棒性/健壯性等要求。
臨床使用限制應當考慮臨床禁用、慎用等場景。
2
數據收集
數據收集應當考慮數據采集、數據預處理、數據標注、數據集構建等活動的質控要求,以保證數據質量和算法設計質量。
1. 數據采集
數據采集主要由臨床機構實施,應當考慮采集設備、采集過程以及數據脫敏的質控要求。
采集設備質控應當明確采集設備的兼容性要求和采集要求。兼容性要求應當基于數據生成方式(直接生成、間接生成)提供采集設備兼容性列表或技術要求,明確采集設備的制造商、型號規(guī)格、性能指標等要求,若對采集設備無具體要求應當提供相應支持資料。采集要求應當明確采集設備的采集方式(如常規(guī)成像、增強成像)、采集協(xié)議(如MRI成像序列)、采集參數(如CT加載電壓、加載電流、加載時間、層厚)、采集精度(如分辨率、采樣率)等要求。
采集過程質控應當建立數據采集操作規(guī)范,明確采集人員要求和采集過程要求。采集人員要求包括人員的選拔、培訓、考核。采集過程要求包括人員職責、采集流程(如采集步驟、操作要求)。
若使用現有歷史數據,應當明確采集設備要求、數據采集質量評估要求(如人員、方法、指標、通過準則)。
采集的數據應當進行數據脫敏以保護患者隱私。數據脫敏應當明確脫敏的類型(靜態(tài)、動態(tài))、規(guī)則、程度、方法。
2. 數據預處理
脫敏數據由臨床機構轉移至生產企業(yè)形成原始數據庫,不同模態(tài)的數據在原始數據庫中應當加以區(qū)分(下同)。
數據預處理應當基于原始數據庫考慮數據處理、數據清洗的質控要求。數據處理應當明確處理的方法,如濾波、增強、重采樣、尺寸裁剪、均一化等。數據清洗應當明確清洗的規(guī)則、方法。
數據處理和清洗應當明確選用軟件工具的名稱、型號規(guī)格、完整版本、供應商、運行環(huán)境、確認等要求,同時考慮數據處理選用方法對軟件的影響及其風險。
數據經預處理后形成基礎數據庫,應當明確樣本類型、樣本量、樣本分布等信息。樣本類型以適用人群為單位可分為數據序列(由多個單一數據組成,如結構序列、功能序列、時間序列)、單一數據。樣本量應當明確樣本規(guī)模及確定依據,需要考慮樣本量不足對軟件的影響及其風險。樣本分布應當依據疾病構成、適用人群、數據來源機構、采集設備、樣本類型等因素明確數據分布情況,需要考慮數據偏性對軟件的影響及其風險。
3. 數據標注
數據標注應當考慮標注資源管理、標注過程質控、標注質量評估等要求。
標注資源管理包括人員管理和基礎設施管理。人員管理應當明確標注人員和仲裁人員的選拔(如職稱、工作年限、工作經驗、所在機構,若有國外人員應當明確其資質要求)、培訓、考核(如方法、頻次、指標、通過準則,其中指標應當包括重復性、再現性)等要求;A設施管理應當明確標注場所(真實或模擬,環(huán)境、照明條件)、標注軟件(名稱、型號規(guī)格、完整版本、供應商、運行環(huán)境、確認)等要求。
標注過程質控應當建立數據標注操作規(guī)范,明確標注人員(如資質、數量、職責)、標注流程(如標注對象、標注形式、標注輪次、標注步驟、操作要求)、臨床診療規(guī)范(如臨床指南、專家共識)、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數據、操作)等要求。
標注質量評估應當明確人員、方法、指標、通過準則等要求。
數據經標注后形成標注數據庫,其樣本類型可分為數據序列、單一數據(由多個數據塊組成)、數據塊(圖像區(qū)域、數據片段)。樣本量、樣本分布等要求及風險考量與基礎數據庫相同。
4.數據集構建
基于標注數據庫構建訓練集(用于算法訓練)、調優(yōu)集(若有,用于算法超參數調優(yōu))、測試集(用于算法性能評估),明確訓練集、調優(yōu)集、測試集的劃分方法、劃分依據、數據分配比例。訓練集應當保證樣本分布具有均衡性,測試集、調優(yōu)集應當保證樣本分布符合臨床實際情況,訓練集、調優(yōu)集、測試集的樣本應當兩兩無交集。
為解決數據樣本分布不滿足預期目標的問題,可對訓練集、調優(yōu)集小樣本量數據進行擴增;測試集不宜進行數據擴增,若擴增應當分析對軟件的影響及其風險。數據擴增應當明確擴增的方式(離線、在線)、方法(如翻轉、旋轉、鏡像、平移、縮放、濾波等)、倍數,并考慮擴增方法選用以及擴增倍數過大對軟件的影響及其風險。
數據經擴增后形成擴增數據庫,應當列表對比擴增數據庫與標注數據庫在樣本量、樣本分布(注明擴增倍數)等方面的差異,以證實擴增數據庫樣本量的充分性以及樣本分布的合理性。
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
8 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市