侵權(quán)投訴
訂閱
糾錯
加入自媒體

“深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評要點(diǎn)”發(fā)布!AI要拿三類證,這幾點(diǎn)做好了嗎?

3

算法設(shè)計(jì)

算法設(shè)計(jì)應(yīng)當(dāng)考慮算法選擇、算法訓(xùn)練、網(wǎng)絡(luò)安全防護(hù)、算法性能評估等活動的質(zhì)控要求。建議數(shù)據(jù)驅(qū)動與知識驅(qū)動相結(jié)合進(jìn)行算法設(shè)計(jì),以提升算法可解釋性。

1. 算法選擇

算法選擇應(yīng)當(dāng)明確所用算法的名稱、結(jié)構(gòu)(如層數(shù)、參數(shù)規(guī)模)、流程圖、現(xiàn)成框架(如Tensorflow、Caffe)、輸入與輸出、運(yùn)行環(huán)境、算法來源依據(jù)(或注明原創(chuàng))等信息。同時應(yīng)當(dāng)明確算法選擇與設(shè)計(jì)的原則、方法和風(fēng)險考量,如量化誤差、梯度消失、過擬合、白盒化等。

若使用遷移學(xué)習(xí)技術(shù),除上述內(nèi)容外還應(yīng)當(dāng)補(bǔ)充預(yù)訓(xùn)練模型的數(shù)據(jù)集構(gòu)建、驗(yàn)證與確認(rèn)等總結(jié)信息。

2. 算法訓(xùn)練

算法訓(xùn)練需要基于訓(xùn)練集、調(diào)優(yōu)集進(jìn)行訓(xùn)練和調(diào)優(yōu),應(yīng)當(dāng)明確評估指標(biāo)、訓(xùn)練方法、訓(xùn)練目標(biāo)、調(diào)優(yōu)方法、訓(xùn)練數(shù)據(jù)量-評估指標(biāo)曲線等要求。

評估指標(biāo)建議根據(jù)臨床需求進(jìn)行選擇,如敏感性、特異性等。訓(xùn)練方法包括但不限于留出法和交叉驗(yàn)證法。訓(xùn)練目標(biāo)應(yīng)當(dāng)滿足臨床要求,提供ROC曲線等證據(jù)予以證實(shí)。調(diào)優(yōu)方法應(yīng)當(dāng)明確算法優(yōu)化策略和實(shí)現(xiàn)方法。訓(xùn)練數(shù)據(jù)量-評估指標(biāo)曲線應(yīng)當(dāng)能夠證實(shí)算法訓(xùn)練的充分性和有效性。

3. 網(wǎng)絡(luò)安全防護(hù)

網(wǎng)絡(luò)安全防護(hù)應(yīng)當(dāng)結(jié)合軟件的預(yù)期用途、使用場景和核心功能,基于保密性、完整性、可得性等網(wǎng)絡(luò)安全特性,確定軟件網(wǎng)絡(luò)安全能力建設(shè)要求,以應(yīng)對網(wǎng)絡(luò)攻擊和數(shù)據(jù)竊取等網(wǎng)絡(luò)威脅。相關(guān)要求詳見網(wǎng)絡(luò)安全指導(dǎo)原則。

此類軟件常見網(wǎng)絡(luò)威脅包括但不限于框架漏洞攻擊、數(shù)據(jù)污染,其中框架漏洞攻擊是指利用算法所用現(xiàn)成框架本身漏洞進(jìn)行網(wǎng)絡(luò)攻擊,數(shù)據(jù)污染是指通過污染輸入數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)攻擊。

4. 算法性能評估

算法性能評估作為軟件驗(yàn)證的重要組成部分,需要基于測試集對算法設(shè)計(jì)結(jié)果進(jìn)行評估,應(yīng)當(dāng)明確假陰性與假陽性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性等評估要求,以證實(shí)算法性能滿足算法設(shè)計(jì)要求。

同時,應(yīng)當(dāng)分析算法性能影響因素及其影響程度,如采集設(shè)備、采集參數(shù)、疾病構(gòu)成、病變特征等因素影響,以提升算法可解釋性,并作為軟件驗(yàn)證、軟件確認(rèn)的基礎(chǔ)。

4

驗(yàn)證與確認(rèn)

1. 軟件驗(yàn)證

軟件驗(yàn)證是指通過提供客觀證據(jù)認(rèn)定軟件開發(fā)、軟件更新某一階段的輸出滿足輸入要求,包括軟件驗(yàn)證測試(單元測試、集成測試、系統(tǒng)測試)、設(shè)計(jì)評審等系列活動。

軟件驗(yàn)證應(yīng)當(dāng)明確法規(guī)、標(biāo)準(zhǔn)、用戶、產(chǎn)品、數(shù)據(jù)、功能、性能、接口、用戶界面、網(wǎng)絡(luò)安全、警示提示等測試要求,以驗(yàn)證軟件的安全性和有效性,并作為軟件確認(rèn)的基礎(chǔ)。

2. 軟件確認(rèn)

軟件確認(rèn)是指通過提供客觀證據(jù)認(rèn)定軟件滿足用戶需求和預(yù)期目的,包括軟件確認(rèn)測試(用戶測試)、臨床評價、設(shè)計(jì)評審等系列活動,其中軟件確認(rèn)測試應(yīng)當(dāng)基于軟件需求在真實(shí)或模擬使用場景下予以實(shí)施。

(1)基本原則

臨床評價是此類軟件進(jìn)行軟件確認(rèn)的主要方式,相關(guān)要求詳見《醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則》。根據(jù)軟件指導(dǎo)原則要求,軟件應(yīng)當(dāng)提交基于臨床試驗(yàn)的臨床評價資料,即提交申報產(chǎn)品的臨床試驗(yàn)資料,或者與申報產(chǎn)品核心算法具有實(shí)質(zhì)等同性的同品種產(chǎn)品或同類軟件功能的臨床試驗(yàn)資料。

進(jìn)口軟件應(yīng)當(dāng)提供中外人種、流行病學(xué)特征、臨床診療規(guī)范等方面差異影響的臨床評價資料,若不足以證實(shí)申報產(chǎn)品在中國使用的安全性和有效性,應(yīng)當(dāng)在中國開展臨床試驗(yàn)。使用境外臨床試驗(yàn)數(shù)據(jù)應(yīng)當(dāng)滿足《接受醫(yī)療器械境外臨床試驗(yàn)數(shù)據(jù)技術(shù)指導(dǎo)原則》要求。

(2)臨床試驗(yàn)

臨床試驗(yàn)應(yīng)當(dāng)符合《醫(yī)療器械臨床試驗(yàn)質(zhì)量管理規(guī)范》要求?蓞⒄铡夺t(yī)療器械臨床試驗(yàn)設(shè)計(jì)指導(dǎo)原則》,基于軟件的預(yù)期用途、使用場景和核心功能進(jìn)行試驗(yàn)設(shè)計(jì),確定觀察指標(biāo)、樣本量估計(jì)、入排標(biāo)準(zhǔn)、隨訪以及實(shí)施機(jī)構(gòu)等要求,以確認(rèn)軟件的安全性和有效性。

建議優(yōu)先選擇同品種產(chǎn)品或臨床參考標(biāo)準(zhǔn)(即臨床金標(biāo)準(zhǔn))進(jìn)行非劣效對照設(shè)計(jì),若無同品種產(chǎn)品且難以獲取臨床參考標(biāo)準(zhǔn)(如違背倫理學(xué)要求)可選擇替代方法,如選擇用戶結(jié)合軟件聯(lián)合決策與用戶單獨(dú)決策進(jìn)行優(yōu)效對照設(shè)計(jì)。非劣效界值或優(yōu)效界值的確定應(yīng)當(dāng)有充分的臨床依據(jù)。此外考慮到用戶的差異性,可選擇多閱片者多病例(MRMC)試驗(yàn)設(shè)計(jì)。

建議結(jié)合適用人群、病變等層面選擇觀察指標(biāo),原則上選擇敏感性、特異性、ROC/AUC作為主要觀察指標(biāo),亦可在此基礎(chǔ)上根據(jù)軟件特點(diǎn)選擇敏感性/特異性衍生指標(biāo)、ROC/AUC衍生指標(biāo)、組內(nèi)相關(guān)系數(shù)、Kappa系數(shù)、時間效率、數(shù)據(jù)有效使用率等指標(biāo)作為觀察指標(biāo)。

入排標(biāo)準(zhǔn)應(yīng)當(dāng)基于目標(biāo)疾病流行病學(xué)特征,保證陽性樣本和陰性樣本選取的合理性和充分性。

建議臨床試驗(yàn)結(jié)果由第三方獨(dú)立評價。

實(shí)施機(jī)構(gòu)應(yīng)當(dāng)具備代表性和廣泛性,不同于訓(xùn)練數(shù)據(jù)主要來源機(jī)構(gòu),地域分布盡可能廣泛,機(jī)構(gòu)數(shù)量盡可能多,以確認(rèn)算法泛化能力。

例如,預(yù)期以提高輔助診斷時間效率為首要目標(biāo)的某軟件,無同品種產(chǎn)品且難以獲取臨床參考標(biāo)準(zhǔn),其臨床試驗(yàn)設(shè)計(jì)可選擇用戶結(jié)合軟件聯(lián)合決策與用戶單獨(dú)決策進(jìn)行交叉對照設(shè)計(jì),以敏感性、特異性、時間效率作為主要觀察指標(biāo),其中敏感性、特異性可為非劣性對照,時間效率指標(biāo)應(yīng)當(dāng)為優(yōu)效對照。

(3)回顧性研究

臨床評價可采用基于現(xiàn)有歷史數(shù)據(jù)的回顧性研究。回顧性研究應(yīng)當(dāng)在設(shè)計(jì)時考慮并必須嚴(yán)格控制偏倚,如選擇偏倚、臨床參考標(biāo)準(zhǔn)偏倚、測量偏倚、記憶偏倚等;仡櫺匝芯吭瓌t上應(yīng)當(dāng)包含多個不同地域臨床機(jī)構(gòu)(非訓(xùn)練數(shù)據(jù)主要來源機(jī)構(gòu))的同期數(shù)據(jù),結(jié)合分層分析、第三方獨(dú)立評價等方法控制偏倚,以保證真實(shí)、準(zhǔn)確評價軟件的安全性和有效性。

回顧性研究應(yīng)當(dāng)基于軟件安全性級別考慮使用問題。對于安全性級別為C級的高風(fēng)險軟件,原則上應(yīng)當(dāng)開展臨床試驗(yàn),此時回顧性研究可用作臨床預(yù)試驗(yàn),為臨床試驗(yàn)設(shè)計(jì)提供參考依據(jù),或者在少見亞組病例入組時間過長等情況下,用作臨床試驗(yàn)的補(bǔ)充。對于安全性級別為B、A級的中低風(fēng)險軟件,回顧性研究可用作臨床預(yù)實(shí)驗(yàn)或替代臨床試驗(yàn)。

軟件安全性級別應(yīng)當(dāng)基于軟件的預(yù)期用途、使用場景和核心功能進(jìn)行綜合判定,判定方法詳見軟件指導(dǎo)原則。例如,預(yù)期用于病理圖像輔助篩查或者危重疾病輔助識別的軟件,其安全性級別通常為C級。

三、軟件更新

1

基本原則

軟件更新應(yīng)當(dāng)考慮對軟件安全性和有效性的影響,包括正面影響和負(fù)面影響。若為重大軟件更新(即影響到軟件安全性或有效性的軟件更新)應(yīng)當(dāng)申請?jiān)S可事項(xiàng)變更,若為輕微軟件更新(即未影響軟件安全性和有效性的軟件更新)則無需申請?jiān)S可事項(xiàng)變更,通過質(zhì)量管理體系進(jìn)行控制。

<上一頁  1  2  3  下一頁>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號