FDA 最近更新的 AI-Enabled Medical Devices 頁面,表面上像是一份產品清單:哪些 AI 醫療裝置已經取得美國上市許可、屬於哪個公司、哪一天做出 final decision。但真正值得看的是清單前面的說明。FDA 明白寫下,為了提高現代 AI 技術使用上的透明度,未來會探索方法,去辨識並標註納入 foundation models 的醫療裝置,範圍從大型語言模型到多模態架構。這不是單純多加一欄表格,而是監管機關開始承認:醫療 AI 的問題,正在從「有沒有核准」變成「裡面到底用了哪一種模型」。
過去幾年,醫療 AI 大多以影像判讀、量測、分診輔助和手術規劃的形式進入 FDA 清單。npj Digital Medicine 去年整理 1,016 筆 FDA AI/ML 相關授權時,也發現影像仍是最大宗,當時被檢視的裝置中還沒有 LLM。這讓 FDA 現在提到 LLM 標註更像提前鋪路:不是說聊天型模型已經全面進入醫療裝置,而是監管機關知道下一波產品可能會把語言、影像、病歷摘要、臨床建議和工作流自動化綁在一起,若還只用傳統產品代碼和簡短摘要來描述,醫院很難看清楚風險。

這件事對醫院採購部門尤其敏感。買一套 AI 影像輔助工具,和買一套會讀報告、生成摘要、呼叫資料庫、甚至建議下一步處置的系統,治理方式不會相同。前者的風險常常集中在資料集、敏感度、特異度、臨床場景和版本變更;後者還會多出 prompt、上下文管理、資料外洩、幻覺、權限串接、責任歸屬與使用者過度信任。若 FDA 未來真的把 foundation model 或 LLM 功能標出來,這個標籤會成為醫院法遵、資安、資訊室和臨床科部共同讀的採購訊號。
Health-ISAC 對 FDA AI 醫療裝置草案的解讀,也把焦點放在這種「會變動的軟體」上。它提到 model drift、bias、data poisoning,以及 predetermined change-control plans、監測、測試與可稽核性。換句話說,醫療 AI 不是送審通過後就永久固定的機器,它更接近一個需要持續管理的臨床軟體生命週期。當 foundation model 進入裝置,這個生命週期又會變得更複雜,因為同一個底層模型可能服務多個功能,更新一次就牽動多個臨床流程。
對病人來說,透明度的意義更直白:他們需要知道眼前的診斷、影像重建、風險分數或文字摘要,究竟是傳統演算法、窄域深度學習模型,還是能處理語言與影像的基礎模型參與其中。這不代表病人必須讀懂模型架構,而是醫療體系需要能清楚說明 AI 扮演了什麼角色、醫師如何覆核、出錯時如何追溯。若一套系統只是幫助影像變清楚,和一套系統主動產生臨床文字建議,病人的知情與信任門檻本來就不同。
這也是為什麼 FDA 的用語仍然保守。它沒有說已經建立強制 LLM 標籤制度,而是說會探索方法,也鼓勵廠商在公開摘要中提供足夠資訊,讓未來清單更容易辨識相關功能。這種寫法留了空間,卻也給業界一個方向:如果產品把基礎模型包進醫療裝置裡,不能只把它說成一般 AI enhancement。公開資料、審查摘要和上市後監測,都需要更精細地描述模型能力與限制。
產業面上,這會改變醫療 AI 新創和大型醫材公司的敘事。過去最有力的銷售語言可能是「FDA-cleared」或「AI-powered」;接下來,買方會追問模型是如何訓練、如何更新、是否可本地部署、是否會把病歷送到外部服務、是否能把輸出拆解給醫師驗證。能把模型治理說清楚的公司,反而可能比單純喊多模態或 LLM 的公司更容易進入醫院。醫療場景不像一般辦公室工具,失誤不是退回重寫,而是可能改變照護路徑。
所以這份清單的訊號,不在於又多了幾個 AI 裝置,而在於 FDA 正在準備替下一代醫療 AI 做分類語言。當模型從判讀影像走向理解文字、整合多模態資料和推動臨床工作流,醫療系統需要的不是更漂亮的 AI 標籤,而是能被採購、法遵、資安、醫師和病人共同使用的透明度。未來醫院買 AI,買的將不只是核准名單上的一個產品名稱,而是一整套能否被稽核、更新、追責與信任的模型治理能力。
參考來源