為規(guī)范人工智能醫(yī)療器械相關(guān)產(chǎn)品的管理,2023年9月15日,國家藥監(jiān)局器審中心組織制定并發(fā)布了《磁共振成像系統(tǒng)人工智能軟件功能審評要點》,本審評要點是對磁共振成像系統(tǒng)人工智能軟件功能的一般要求,醫(yī)療器械注冊申請人應(yīng)依據(jù)產(chǎn)品的具體特性確定其中的內(nèi)容是否適用。若不適用,需具體闡述其理由及相應(yīng)的科學依據(jù),并依據(jù)具體的產(chǎn)品特性對注冊申報資料的內(nèi)容進行充實和細化。
為規(guī)范人工智能醫(yī)療器械相關(guān)產(chǎn)品的管理,2023年9月15日,國家藥監(jiān)局器審中心組織制定并發(fā)布了《磁共振成像系統(tǒng)人工智能軟件功能審評要點》,本審評要點是對磁共振成像系統(tǒng)人工智能軟件功能的一般要求,醫(yī)療器械注冊申請人應(yīng)依據(jù)產(chǎn)品的具體特性確定其中的內(nèi)容是否適用。若不適用,需具體闡述其理由及相應(yīng)的科學依據(jù),并依據(jù)具體的產(chǎn)品特性對注冊申報資料的內(nèi)容進行充實和細化。
磁共振成像系統(tǒng)人工智能軟件功能審評要點
本審評要點是對磁共振成像系統(tǒng)人工智能軟件功能的一般要求,申請人應(yīng)依據(jù)產(chǎn)品的具體特性確定其中的內(nèi)容是否適用。若不適用,需具體闡述其理由及相應(yīng)的科學依據(jù),并依據(jù)具體的產(chǎn)品特性對注冊申報資料的內(nèi)容進行充實和細化。
本審評要點是供注冊申請人和技術(shù)審評人員使用的指導性文件,但不包括注冊審批所涉及的行政事項,亦不作為法規(guī)強制執(zhí)行,應(yīng)在遵循相關(guān)法規(guī)的前提下使用本審評要點。如果有能夠滿足相關(guān)法規(guī)要求的其他方法,也可以采用,但是需要提供詳細的研究資料和驗證資料。
本審評要點是在現(xiàn)行法規(guī)和標準體系以及當前認知水平下制定的,隨著法規(guī)和標準的不斷完善,以及科學技術(shù)的不斷發(fā)展,相關(guān)內(nèi)容也將適時進行調(diào)整。
本審評要點不包含臨床評價的要求,也不包含人工智能倫理、數(shù)據(jù)產(chǎn)權(quán)等法律法規(guī)層面要求。
一、適用范圍
本審評要點適用于采用人工智能技術(shù)(artificial intelligence, AI)的磁共振(magnetic resonance, MR)成像系統(tǒng)。按照現(xiàn)行有效的《醫(yī)療器械分類目錄》,該類產(chǎn)品分類編碼為06-09,管理類別為III類。
本審評要點所指的AI軟件功能,必須運行于MR系統(tǒng),且作為軟件組件隨MR系統(tǒng)進行注冊。某些AI軟件功能以專用型獨立軟件形式呈現(xiàn),運行于MR系統(tǒng)的通用計算平臺(工作站等),如其作為附件隨MR系統(tǒng)進行注冊,可以視為MR系統(tǒng)的軟件組件。
二、產(chǎn)品簡介
MR成像無電離輻射危害,具有良好的圖像對比度,是臨床常見的影像學檢查方法。近年來,MR系統(tǒng)的磁場強度和成像分辨率不斷提升,多參數(shù)和定量化的成像序列不斷涌現(xiàn),移動式、超低場的產(chǎn)品也逐漸用于臨床。基于大數(shù)據(jù)的AI技術(shù)進一步推動了相關(guān)行業(yè)發(fā)展,除了利用AI技術(shù)進行MR圖像處理的獨立軟件產(chǎn)品,MR系統(tǒng)本身也開始通過AI技術(shù)實現(xiàn)產(chǎn)品賦能。
(一)成像優(yōu)化
利用AI技術(shù)對MR成像進行功能完善和性能提升,常見應(yīng)用場景包括:① 改善圖像質(zhì)量(例如:圖像降噪、運動偽影去除等);② 優(yōu)化圖像重建(例如:欠采樣重建、超分辨率重建、多參數(shù)定量圖像重建等);③ 提升成像速度(例如:減少掃描時間,優(yōu)化動態(tài)成像、實時成像的性能等)。
(二)工作流程優(yōu)化
利用AI技術(shù)提升MR系統(tǒng)的工作流程的質(zhì)量和效率,例如:在磁共振定位像中智能規(guī)劃掃描區(qū)域和層面,減少人工操作時間,提高掃描定位的準確性和可重復(fù)性。
(三)定量計算
利用AI技術(shù)在MR圖像中對器官、組織、病灶等進行定量分析(例如:體積、圖像紋理、生理參數(shù)等),輸出結(jié)果用于診斷、治療及療效評估。定量計算軟件功能一般用于處理圖像或其他類型數(shù)據(jù),其臨床應(yīng)用場景可能涉及輔助分診、輔助檢測、輔助評估、輔助診斷、輔助治療等,通常不控制成像硬件、不干預(yù)掃描操作。
從MR系統(tǒng)掃描和輸出圖像的角度,AI軟件功能也可以按照涉及的產(chǎn)品模塊或成像過程進行劃分,例如:準備、掃描、前處理[1]、后處理等。由于MR系統(tǒng)復(fù)雜度較高,各種劃分方法在一定程度上存在交叉和重疊,某個軟件功能可能同時對前處理、后處理等多個環(huán)節(jié)產(chǎn)生較大影響,需要依據(jù)工作原理、預(yù)期用途、產(chǎn)品功能、臨床使用場景等進行綜合評價。
四、審評主要關(guān)注點
在參照適用的法規(guī)、規(guī)章、指導原則和標準的前提下,請結(jié)合下列關(guān)注點開展技術(shù)審評。
(一)綜述資料
參考《醫(yī)療器械通用名稱命名規(guī)則》的要求,具有AI軟件功能的MR系統(tǒng)宜采用通用名稱,即“磁共振成像系統(tǒng)”或“磁共振成像設(shè)備”,醫(yī)療器械注冊證載明的產(chǎn)品名稱中不宜增加“智能”等修飾詞。此外,產(chǎn)品結(jié)構(gòu)組成和適用范圍一般與常規(guī)MR系統(tǒng)的注冊證載明信息保持一致,例如:“該產(chǎn)品由3.0T超導磁體、射頻線圈、......組成”、“該產(chǎn)品適用于臨床磁共振成像診斷或檢查”。
申請人可以在產(chǎn)品技術(shù)要求或產(chǎn)品說明書中體現(xiàn)AI軟件功能。
由于MR系統(tǒng)已經(jīng)按照第三類醫(yī)療器械進行管理,即風險最高的管理類別,所以是否采用AI技術(shù)不會導致其調(diào)增產(chǎn)品管理類別。
采用AI技術(shù)的MR系統(tǒng)在注冊申報時,需要針對具體的AI軟件功能,逐項描述工作原理、處理對象、適用疾?。ㄈ暨m用)、適用人群、適用人體部位、臨床用途、使用限制、禁忌證等內(nèi)容。若適用,請?zhí)峁〢I軟件功能關(guān)于兒童應(yīng)用的必要說明和評價資料。對于某些僅適用于兒童或成人的軟件功能,建議在產(chǎn)品技術(shù)要求和說明書中進行提示和說明。
以AI降噪功能為例,需要說明兼容的成像序列(類型、2D/3D、是否加速采集等)、射頻線圈(類型、部位、發(fā)射/接收等)的要求,以及輸出圖像類型(定量或非定量等)、適用人群和人體部位、使用限制等信息。
(二)非臨床資料
1. 產(chǎn)品風險管理資料
目前,AI技術(shù)已融入臨床MR檢查的各個環(huán)節(jié),需要采用基于風險的全生命周期管理方法進行科學監(jiān)管,風險管理活動應(yīng)依據(jù)預(yù)期用途(用途類型、目標部位和疾病、重要程度、緊急程度等)、使用場景(適用人群、疾病特征、目標用戶、使用場合、臨床流程等)、核心功能(核心算法、處理對象、數(shù)據(jù)兼容性、功能類型等)予以實施。
成像優(yōu)化的主要風險是AI技術(shù)導致圖像質(zhì)量下降或損失關(guān)鍵診斷信息,例如:快速成像的加速倍數(shù)過高、掃描時間過短,導致圖像質(zhì)量下降的風險;圖像降噪、運動偽影去除等軟件功能導致圖像失真的風險。
工作流程優(yōu)化同樣需要考慮是否引入了類似的風險。以掃描層面自動定位功能為例,如果出現(xiàn)定位錯誤,可能導致無法獲得預(yù)期目標圖像、成像質(zhì)量下降的風險,相應(yīng)的風險緩解措施包括改進層面位置和方向的顯示方式、提示操作者確認自動定位結(jié)果、允許操作者手工調(diào)整等。
涉及定量計算的軟件功能,定量結(jié)果錯誤或偏差可能對患者診療方案造成較大影響,是影響風險分析結(jié)果的關(guān)鍵因素,需要對其危害程度進行詳細分析。在輸出定量指標時,宜提供與定量指標相關(guān)的其他輔助信息,盡可能降低定量結(jié)果錯誤或偏差導致的診療決策錯誤的風險(詳見附件1)。
已上市的MR系統(tǒng)通過變更注冊申請新增AI軟件功能,可能會導致原有產(chǎn)品或功能的預(yù)設(shè)參數(shù)、掃描方式、用戶操作習慣等發(fā)生較大變化,申請人應(yīng)對相關(guān)風險予以識別并采取必要措施。
2. 產(chǎn)品技術(shù)要求及檢驗報告
依據(jù)AI軟件功能的臨床用途,預(yù)期對產(chǎn)品安全有效性產(chǎn)生重要影響的項目,宜在產(chǎn)品技術(shù)要求中制定相應(yīng)的、具體的性能指標條款,且條款內(nèi)容需要準確、簡要、客觀的描述其所實現(xiàn)的產(chǎn)品功能。
以圖像降噪功能為例,宜按照用戶可選的圖像降噪級別,分別驗證各級輸出的圖像質(zhì)量。其他宣稱具有改善圖像質(zhì)量或提升成像速度等相似用途的軟件功能,均建議參考以上示例,制定適宜的性能指標條款。若軟件功能的運行時間是影響產(chǎn)品臨床使用的重要因素,則建議選取典型應(yīng)用場景并規(guī)定相應(yīng)的性能效率要求。
此外,申請人需要說明AI軟件功能的使用條件或限制條件,以及檢驗用線圈、適用部位、成像序列及掃描參數(shù)等重要內(nèi)容,并提供檢驗典型性的必要說明,具體示例詳見附件2。
3. 研究資料
3.1 軟件研究
3.1.1 軟件
軟件研究報告需要列表描述采用AI技術(shù)的產(chǎn)品核心功能和核心算法,宜提供專題研究資料。申請人應(yīng)依據(jù)AI軟件功能的技術(shù)特點、風險程度和應(yīng)用場景,開展相應(yīng)的軟件測試,并保證軟件驗證和確認的質(zhì)量。
若AI軟件功能已在境外獲批上市,建議提供相關(guān)產(chǎn)品功能的境外上市批件,以及境外上市申報提交的軟件研究資料。
涉及定量計算的軟件功能,需要提供其輸出結(jié)果的準確性、一致性等方面的評價資料(詳見附件1)。
3.1.2 網(wǎng)絡(luò)安全
若AI軟件功能具有遠程訪問與控制接口,或采用了云計算、移動計算等《醫(yī)療器械軟件注冊審查指導原則(2022年修訂版)》第七章中提及的其他相關(guān)功能,需要結(jié)合產(chǎn)品預(yù)期用途、使用場景和核心功能,基于保密性、完整性、可得性等網(wǎng)絡(luò)安全特性,對相關(guān)風險予以重點關(guān)注。
4. 其他資料
申請人在開展MR系統(tǒng)AI軟件功能的評價研究時,宜參考《人工智能醫(yī)療器械注冊審查指導原則》的適用內(nèi)容,重點關(guān)注訓練數(shù)據(jù)質(zhì)量控制、算法泛化能力、臨床使用風險等關(guān)鍵因素,并結(jié)合《醫(yī)療器械軟件注冊審查指導原則》、《醫(yī)療器械網(wǎng)絡(luò)安全注冊審查指導原則》、《醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范獨立軟件附錄》等規(guī)范性文件的要求,提供專題研究資料。
除上述通用要求之外,基于MR成像原理及其圖像固有特征,建議申請人參考下文內(nèi)容對AI軟件功能進行充分評價。
4.1 算法原理和實現(xiàn)過程
申請人應(yīng)針對具體軟件功能描述所用AI技術(shù)和涉及的產(chǎn)品模塊。一般而言,僅用于前處理或后處理的AI軟件功能的算法原理和實現(xiàn)過程存在較大差異。
考慮到可追溯性、可解釋性等AI技術(shù)難點尚未完全解決,申請人需要重點關(guān)注算法原理,以及所用算法與MR成像物理過程的相關(guān)性(若適用),避免AI算法產(chǎn)生非預(yù)期的圖像失真等類型的錯誤(例如:信號丟失、圖像分辨率劣化、病灶及周圍組織形態(tài)改變等)。
4.2 訓練數(shù)據(jù)和歸一化、泛化能力
MR圖像的像素值通常反映的是人體組織間相對變化程度,并不直觀對應(yīng)于某個明確的物理量(例如:CT圖像的HU值),難以直接用于定量分析。除了人群因素影響(地域、年齡、性別等),即使是對相同患者和部位進行掃描,MR設(shè)備的型號、場強、操作者等諸多因素均會導致圖像產(chǎn)生較大差異,不同序列采集圖像之間直接比較像素值也缺乏實際意義。上述問題源于MR成像技術(shù)本身,也源于臨床缺乏標準化掃描協(xié)議,進而影響AI軟件功能的泛化能力。
運行于MR系統(tǒng)計算平臺的AI軟件功能,一般與MR系統(tǒng)源自同一制造商,可以在多個MR系統(tǒng)上進行部署,同時也存在集成第三方現(xiàn)成軟件實現(xiàn)AI賦能的情況。針對復(fù)雜應(yīng)用環(huán)境,AI軟件功能的訓練數(shù)據(jù)除了滿足一定的規(guī)模要求之外,還需要充分考慮數(shù)據(jù)的多樣性,包括掃描方式(2D/3D、平掃/增強、擴散加權(quán)、MRA等)、掃描參數(shù)(場強、層數(shù)、層厚、層間距、成像矩陣等)和圖像質(zhì)量(偽影、噪聲等)等因素,以及不同MR系統(tǒng)和制造商的影響,以保證AI軟件功能面對臨床實際圖像具有良好的歸一化能力。若適用,歸一化能力可以采用定量指標進行評價,例如:選取不同來源的圖像進行歸一化處理,并對所得圖像的像素均值、方差、極值、直方圖形態(tài)等進行測試分析。
對于某些圖像處理算法,可能采用自然照片等其他模態(tài)圖像進行預(yù)訓練,通過遷移學習等方式,生成適合MR圖像的最終模型。受限于MR圖像獲取難度較大,采用類似策略可以快速擴大訓練數(shù)據(jù)集規(guī)模,提升模型性能,但是需要關(guān)注其輸出圖像是否符合預(yù)期質(zhì)量要求,以及驗證方法的合理性。若適用,需要重點關(guān)注數(shù)據(jù)擴增方法的合理性,以及數(shù)據(jù)擴增對模型訓練造成的潛在不良影響,對數(shù)據(jù)偏倚等風險采取有效控制措施,具體內(nèi)容詳見《人工智能醫(yī)療器械注冊審查指導原則》。
4.3 驗證與確認
4.3.1 軟件功能驗證
AI軟件功能應(yīng)按照設(shè)計需求及功能定義,參考典型應(yīng)用場景開展驗證工作。建議關(guān)注AI算法導致的變化(產(chǎn)品功能、工作流程等),結(jié)合輸入輸出特征,合理規(guī)定測試條件,完成軟件功能的整體驗證,確認相關(guān)變化符合設(shè)計需求。一般而言,與傳統(tǒng)方法或非AI賦能的其他方法相比,AI軟件功能的綜合評價結(jié)果應(yīng)至少是非劣效的。
4.3.2 軟件功能確認
一般需要客觀證據(jù)證明AI軟件功能可以滿足用戶需求和預(yù)期目的,包括軟件確認測試、臨床使用、設(shè)計評審等系列活動。建議按照具體設(shè)計需求,在真實或模擬臨床應(yīng)用場景下實施軟件功能確認。
4.4 關(guān)鍵技術(shù)特征
4.4.1 定量計算
按照難易程度,定量計算可大致分為兩類:簡單定量計算功能,常用于直接客觀測量的物理量(長度、角度、面積等),宜明確測量范圍、誤差等指標要求;復(fù)雜定量計算功能,常用于涉及間接測量的對象和場景,包括病灶分割、物質(zhì)分解和量化等。具體內(nèi)容詳見附件1。
以MR圖像數(shù)據(jù)的定量計算為例,輸入圖像質(zhì)量及掃描參數(shù)(層厚、層間距、層內(nèi)分辨率等)可能對輸出結(jié)果產(chǎn)生較大影響[2],需要采取相應(yīng)措施(例如:增加圖像歸一化等預(yù)處理環(huán)節(jié);對測量結(jié)果及偏差給予必要的用戶提示等)。此外,建議結(jié)合應(yīng)用場景和目標用戶,合理選用計量單位,例如:相對于物理長度單位,采用像素數(shù)量作為計量單位,在某些情況下可能更易于理解和使用。
4.4.2 多參數(shù)成像
采用多參數(shù)成像序列,以及特定的圖像重建和處理方法,一次掃描可以獲得多個具有診斷意義的參數(shù)指標。AI技術(shù)結(jié)合多參數(shù)成像,除了優(yōu)化掃描過程,也可以最大化利用各個參數(shù)之間的互信息,進一步提升輸出結(jié)果的準確性。
若適用,需要明確AI軟件功能兼容的多參數(shù)成像序列,詳細描述標準操作流程和具體要求,并全面評估其魯棒性。例如:圖像降噪功能是否適合多參數(shù)成像輸出的所有圖像類型;如果部分圖像或參數(shù)缺失而導致輸入數(shù)據(jù)不完整,基于多參數(shù)成像的定量分析功能是否具有防止輸出錯誤結(jié)果的相應(yīng)措施。
4.4.3 擬合其他模態(tài)圖像數(shù)據(jù)
通過特殊采集和處理的MR圖像,可以用于擬合生成CT圖像(以下簡稱合成CT),類似應(yīng)用還包括擬合生成DR圖像等。
MR圖像的軟組織對比度較好,適合放療靶區(qū)勾畫以及圖像引導,但是存在像素值絕對定量困難等問題。采用AI技術(shù)對MR圖像進行HU值預(yù)測,獲得的合成CT圖像保留了軟組織對比度優(yōu)勢,預(yù)期可以替代真實CT圖像用于放療計劃和模擬。合成CT圖像一般需要特定的掃描序列和處理方法,例如:水脂分離成像等。
AI軟件功能用于擬合其他模態(tài)圖像時,需要詳細說明輸入數(shù)據(jù)和輸出數(shù)據(jù)的具體要求,以及輸出數(shù)據(jù)的具體臨床用途。輸入數(shù)據(jù)一般是MR圖像和必要的成像參數(shù)(掃描序列、采集方式等)。輸出數(shù)據(jù)一般是擬合生成的其他模態(tài)圖像及其輔助信息,并需要符合預(yù)期的質(zhì)量要求。
(三)產(chǎn)品說明書和標簽樣稿
產(chǎn)品說明書需要詳細描述AI軟件功能,包括臨床使用的注意事項、局限性、警示或提示等重要內(nèi)容,必要時可以通過專題章節(jié)進行講解,以最大程度緩解AI技術(shù)的已知風險,也可參考附件1的適用內(nèi)容和要求。
(四)體系考核關(guān)注點
對采用AI技術(shù)的MR系統(tǒng)開展生產(chǎn)質(zhì)量體系核查時,建議核查人員結(jié)合本審評要點第三章節(jié)內(nèi)容,逐項梳理AI軟件功能的清單,并重點關(guān)注設(shè)計開發(fā)資料。
五、《醫(yī)療器械安全和性能基本原則清單》各項內(nèi)容的適用性
略