AI 在醫療健康的應用：從影像診斷到藥物發現

Q: AI 在醫療健康的應用？從影像診斷到藥物發現？

醫學影像判讀、病歷摘要、藥物開發、精準醫療、健康監測——醫療 AI 實戰案例。

一、學習目標

完成本單元後，你將能夠：

說明醫療業導入 AI 的迫切背景與結構性需求
描述 CNN 與 U-Net 在醫學影像診斷中的應用方式
理解臨床 NLP 如何處理病歷資料與醫療編碼
解釋 AI 如何加速藥物發現並介紹 AlphaFold 的意義
說明精準醫療（Precision Medicine）的核心概念
掌握遠距健康監測的 AI 技術架構
理解醫療 AI 的特有挑戰：隱私、可解釋性、法規審查
說明聯邦學習（Federated Learning）在醫療場域的重要性

二、核心內容

2-1 醫療業為何迫切需要 AI？

生活比喻：一位資深放射科醫師每天要判讀數百張影像，相當於一個人要同時讀完數十本書並逐字找錯，體力與注意力的極限終將到來，AI 就是那個永不疲倦的助手。

醫療 AI 的需求來自三個結構性壓力：

1. 全球醫師短缺與高齡化浪潮

世界衛生組織估計，2030 年全球將短缺 1,000 萬名醫護人員。同時，高齡化社會帶來更龐大的診療需求，人力供需缺口不斷擴大。

2. 醫療資料的爆炸性成長

每位患者一生產生的健康資料（影像、基因組、電子病歷、穿戴裝置數據）已超過人類醫師能夠全面消化的範圍。AI 能從海量資料中萃取人眼難以察覺的模式。

3. 精準化診療的需求

傳統醫學是「平均人」醫學，同樣的藥對不同基因型的患者效果可能天差地別。AI 結合基因組資料，讓「為每個人量身訂製的治療方案」成為可能。

2-2 應用一：醫學影像診斷（Medical Imaging）

生活比喻：教一個醫學生看 X 光需要幾年；AI 模型「看」了百萬張有標籤的影像後，準確率可達資深放射科醫師水準，而且永遠不會因為值班太久而分心。

核心技術

① CNN（Convolutional Neural Network，卷積神經網路）

CNN 是醫學影像分析的主力模型，擅長從像素矩陣中識別局部特徵（邊緣、紋理、形狀），進而判斷影像中是否存在腫瘤、出血、骨折等異常。

X 光：肺炎偵測、骨折識別、胸腔異常篩查
CT 掃描：肺結節偵測、腦出血判讀、冠狀動脈狹窄評估
MRI：腦腫瘤分割、脊椎病變分析
病理切片（Pathology）：癌細胞分類、病理分期判定

② U-Net（語意分割模型）

U-Net 是醫學影像分割（Segmentation）的標準架構，能精確標記出病灶的輪廓範圍（例如腫瘤的確切邊界），而不只是分類「有沒有腫瘤」。

輸入：MRI 腦部影像
  ↓ U-Net 語意分割
輸出：腫瘤區域精確輪廓（像素級標記）
  ↓ 臨床應用
放療計劃：精確定義照射範圍，減少對正常組織的傷害

FDA 核准的 AI 醫療器材（AI-Enabled Medical Devices）

美國食品藥物管理局（FDA）已核准超過 500 項 AI/ML 醫療器材，主要集中於放射科（Radiology）與心臟科（Cardiology）。知名案例包括 Google DeepMind 的眼底影像糖尿病視網膜病變篩查系統（準確率達眼科醫師水準）。

核心挑戰：罕見疾病的資料稀缺性

挑戰	說明
資料量不足	罕見疾病案例少，難以蒐集足夠的標注訓練資料
標注成本極高	每張影像需要專科醫師標注，時間與費用昂貴
跨院資料差異	不同廠牌的 CT/MRI 設備產出影像風格不同，模型泛化能力受限
解決方向	遷移學習（Transfer Learning）、合成資料生成（GAN）、聯邦學習（Federated Learning）

2-3 應用二：臨床 NLP 與病歷摘要（Clinical NLP）

生活比喻：醫師每天要翻閱數十份厚重病歷，從中找出關鍵資訊，AI 就像一個精準的閱讀助理，能在數秒內摘要出最重要的內容。

BERT 在醫療場域的應用

通用 BERT 模型在醫療文本上效果有限，因此出現了專門用醫療文獻預訓練的版本：

模型	預訓練資料	應用
BioBERT	PubMed 醫學論文	醫學文獻挖掘、關係抽取
ClinicalBERT	電子病歷（EHR）	病歷摘要、再入院預測
Med-PaLM（Google）	醫療知識 + RLHF	回答醫學問題

ICD 編碼自動化

ICD（International Classification of Diseases，國際疾病分類碼）是全球醫院用來記錄診斷的標準編碼系統（如 J18.9 = 肺炎）。傳統上由醫療編碼員人工對照，AI 可透過 NLP 自動從病歷文字中識別並指派正確的 ICD 碼，大幅節省行政人力。

核心挑戰

醫療術語複雜性：縮寫歧義（如「PT」可能指 Patient、Physical Therapy 或 Prothrombin Time）
資料隱私：病歷含高度敏感個人資訊，資料共享受《個人資料保護法》及 HIPAA 嚴格限制
非結構化資料比例高：超過 80% 的醫療資訊存在於自由文字（醫師手寫的問診紀錄）中

2-4 應用三：AI 加速藥物發現（Drug Discovery）

生活比喻：傳統藥物開發像在大海中撈針，數百萬種化合物中找出對疾病有效且安全的那一顆。AI 讓這個過程從隨機撈針，變成有系統的精準搜索。

傳統 vs. AI 驅動的藥物開發

階段	傳統方式	AI 輔助
靶點識別	人工文獻回顧	NLP 挖掘論文、知識圖譜
化合物篩選	高通量實驗室篩選（HTS）	AI 預測分子活性，減少實驗次數
藥物設計	化學家設計合成路徑	生成模型（VAE、GAN）生成候選分子
毒性預測	動物實驗	AI 預測 ADMET 性質
臨床試驗	人工篩選受試者	AI 比對基因型匹配最適受試族群

整體開發週期：傳統超過 10 年、耗資逾 10 億美元；AI 輔助有望縮短至 4-6 年。

AlphaFold：蛋白質結構預測的里程碑

2021 年，DeepMind 的 AlphaFold 2 解決了分子生物學長達 50 年的難題，蛋白質折疊問題（Protein Folding Problem）：僅憑胺基酸序列，精準預測蛋白質的三維結構。

生活比喻：蛋白質就像一條長項鍊，會自動折疊成特定形狀來執行功能。以前科學家要用 X 射線結晶學花費數年才能確定形狀；AlphaFold 在幾分鐘內就能預測出來，準確率媲美實驗室。

AlphaFold 已預測超過 2 億個蛋白質結構，開放全球研究者免費使用，被視為近年來最重要的 AI 科學突破之一。

圖神經網路（GNN）在藥物化學中的應用

分子結構天然是圖結構（原子 = 節點，化學鍵 = 邊），GNN 能直接在分子圖上學習，預測藥物的：

與靶蛋白的結合親和力（Binding Affinity）
藥物毒性（Toxicity）
藥物交互作用（Drug-Drug Interaction）

2-5 應用四：精準醫療（Precision Medicine）

生活比喻：傳統醫療就像給全班同學穿同一尺寸的衣服；精準醫療是為每個人量身裁製，根據你獨特的基因型、生活習慣、病史，設計最適合你的治療方案。

基因組學 + AI 的整合

基因型預測治療反應：特定基因變異（如 BRCA1 突變）決定乳癌治療方案
生物標記（Biomarker）預測：AI 從基因表達資料中識別預測預後的生物標記
癌症亞型分類：同樣叫做「肺癌」的疾病可能有數十種基因型亞型，治療策略大不同

台灣精準醫療案例

台灣人體生物資料庫（Taiwan Biobank）收集超過 15 萬名參與者的基因與健康資料，結合健保資料庫，成為全球最具規模的精準醫療研究資源之一，已支援多項 AI 研究計劃。

2-6 應用五：遠距健康監測（Remote Health Monitoring）

生活比喻：過去只有在醫院量血壓才算「有紀錄」；現在你手腕上的智慧手錶每分鐘都在監測心率，AI 持續分析這些資料，在問題發生前就發出預警。

技術架構：穿戴裝置 + IoT + AI

穿戴裝置（Apple Watch / 連續血糖監測儀 / 智慧床墊）
  ↓ 即時感測資料（心率、SpO2、血壓、睡眠）
IoT 閘道器（Edge Computing 初步過濾）
  ↓ 結構化時序資料
AI 分析引擎（雲端或邊緣推論）
  ↓ 異常偵測 / 早期預警
  ├→ 通知患者 App
  └→ 警示醫療團隊 / 家屬

高齡照護中的關鍵應用

應用	技術	效益
跌倒偵測	加速度計 + 分類模型	第一時間通知家屬與緊急服務
心房顫動偵測	Apple Watch ECG + CNN	早期發現中風高風險
睡眠呼吸中止症篩查	麥克風 + 呼吸感測 + AI	居家篩查，減少睡眠檢查等候時間
糖尿病管理	連續血糖監測 + RL 胰島素幫浦	自動調整胰島素劑量
失智症早期預警	行為模式 AI 分析	從日常活動變化偵測認知衰退

2-7 醫療 AI 的特有挑戰

① 資料隱私：HIPAA 與台灣個資法

醫療資料是最敏感的個人資料，受到嚴格法律保護：

美國 HIPAA（健康保險可攜性和責任法案）：規定醫療資料的使用、存儲、傳輸標準
台灣《個人資料保護法》：病歷屬於特種個人資料，原則上禁止處理，須取得明確同意

② 模型可解釋性與臨床信任

醫師在決定是否採納 AI 建議時，需要知道「為什麼」，而不只是「答案是什麼」。一個說「這顆腫瘤是惡性的，機率 87%」的模型，若無法解釋依據，醫師難以對患者交代，法律責任也無從釐清。

可解釋性工具：Grad-CAM（Gradient-weighted Class Activation Mapping），在影像上以熱力圖標示出模型做出決策的「關注區域」，讓醫師看到 AI 是否真的在看「對的地方」。

③ 監管審查與上市許可

AI 醫療器材必須通過嚴格的臨床驗證才能上市：

美國 FDA：510(k) 或 De Novo 途徑審查
台灣 TFDA（食品藥物管理署）：AI 醫療器材需提交臨床效能報告
模型更新後是否需要重新申請許可？FDA 已提出「預定變更控制計劃（PCCP）」框架應對此挑戰

④ 臨床資料的偏見問題

歷史醫療資料常有系統性偏見：

訓練資料大多來自大型教學醫院，對農村患者或特定族裔的代表性不足
若 AI 皮膚癌偵測模型主要用白種人皮膚訓練，在深色皮膚上的準確率可能顯著下降

2-8 聯邦學習（Federated Learning）：醫院之間如何安全共享 AI？

生活比喻：你想讓十家醫院的 AI 集體變聰明，但每家醫院的病人資料都不能外流，聯邦學習的解法是：「讓模型出門旅行，不讓資料離家。」

傳統方式的困境

將多家醫院的病歷集中到同一台伺服器訓練，雖然能獲得最多資料，但違反《個資法》和醫院間的保密協議，在實務上幾乎不可能實現。

聯邦學習的運作方式

中央伺服器（協調者）
  ↓ 下發初始模型
醫院 A         醫院 B         醫院 C
（本地訓練）   （本地訓練）   （本地訓練）
  ↓               ↓               ↓
上傳模型梯度（非原始資料）
  ↓
中央伺服器聚合梯度（FedAvg 演算法）
  ↓
更新後的全域模型再下發給各醫院

資料不離院：各醫院只上傳模型更新（梯度），原始病患資料留在院內
集體智慧：最終模型受益於所有醫院的資料多樣性，泛化能力更強
差分隱私（Differential Privacy）：在梯度中加入雜訊，進一步防止從梯度反推原始資料

三、關鍵名詞中英對照

中文	英文
醫學影像	Medical Imaging
卷積神經網路	Convolutional Neural Network (CNN)
語意分割	Semantic Segmentation
蛋白質折疊	Protein Folding
圖神經網路	Graph Neural Network (GNN)
精準醫療	Precision Medicine
生物標記	Biomarker
基因組學	Genomics
電子病歷	Electronic Health Record (EHR)
遠距健康監測	Remote Health Monitoring
穿戴裝置	Wearable Device
聯邦學習	Federated Learning
差分隱私	Differential Privacy
國際疾病分類碼	ICD (International Classification of Diseases)
梯度	Gradient
遷移學習	Transfer Learning
可解釋 AI	Explainable AI (XAI)
熱力圖	Heatmap / Grad-CAM
藥物發現	Drug Discovery
高通量篩選	High-Throughput Screening (HTS)
健康保險可攜性和責任法案	HIPAA (Health Insurance Portability and Accountability Act)
邊緣運算	Edge Computing
心房顫動	Atrial Fibrillation

四、考試重點提示

重點 1：醫學影像的核心技術 CNN 用於影像分類（有沒有病灶），U-Net 用於影像分割（病灶的精確輪廓）。考試常考這兩者的差異與應用情境。

重點 2：AlphaFold 的歷史意義 AlphaFold 2 解決了長達 50 年的蛋白質折疊問題，能從胺基酸序列預測蛋白質三維結構，已預測超過 2 億個蛋白質，大幅加速藥物發現。這是近年最常被考的 AI 科學突破案例之一。

重點 3：聯邦學習解決醫療資料隱私問題 醫療資料無法集中，聯邦學習讓「模型到各院訓練，只傳梯度不傳資料」。考試重點：資料不離院、上傳梯度（非原始資料）、FedAvg 演算法聚合、差分隱私加雜訊保護。

重點 4：醫療 AI 四大挑戰 資料隱私（HIPAA/個資法）、模型可解釋性（臨床信任）、法規審查（FDA/TFDA）、訓練資料偏見（族群代表性不足）。這四點是醫療 AI 有別於其他產業 AI 的特殊障礙。

重點 5：精準醫療 vs. 傳統醫療 傳統醫療是「平均人」模型，精準醫療結合基因組資料為每位患者量身定制治療方案。台灣人體生物資料庫是重要的本土案例。

1. U-Net 與一般 CNN 分類模型在醫學影像任務上的主要差異是什麼？請各舉一個適合的應用情境說明。

2. AlphaFold 2 解決了什麼科學難題？它的輸入和輸出各是什麼？為何這對藥物發現有重大意義？

3. 以下哪項描述最能說明聯邦學習（Federated Learning）的核心原理？

(A) 將所有醫院的病患資料集中到同一台伺服器進行統一訓練
(B) 各醫院在本地訓練模型，只將模型梯度上傳至中央伺服器聚合
(C) 使用資料加密技術，讓各醫院的資料可以安全地跨院傳輸
(D) 由一家醫院訓練好模型後，直接複製給其他醫院使用

4. 一個皮膚癌 AI 診斷模型，訓練資料幾乎全來自白種人患者。這個模型部署到東南亞醫院後，準確率顯著下降。請從「資料偏見」角度分析原因，並提出一個改善方案。

5. 醫療 AI 對「模型可解釋性」的要求，為何比一般商業 AI（如廣告推薦）更嚴格？請從臨床信任與法律責任兩個角度說明。

解答與解析

題號	答案
1	CNN 做影像分類（有無病灶）；U-Net 做像素級分割（病灶精確輪廓）
2	蛋白質折疊問題；輸入胺基酸序列，輸出三維結構；加速靶點識別與藥物設計
3	(B)
4	訓練資料族群代表性不足；改善方案：納入多元族群資料重新訓練，或使用遷移學習微調
5	醫療決策影響患者生命安全，醫師需理解依據；法律上醫師須對患者說明治療理由，黑箱模型無法承擔責任

詳細解析：

第 1 題：

CNN 分類模型：輸出是整張影像的標籤（如「此 X 光有肺炎 / 沒有肺炎」），適合篩查任務。應用情境：胸腔 X 光的肺炎分類、眼底影像的糖尿病視網膜病變有無判斷。
U-Net 分割模型：輸出是每個像素的類別標籤，能精確描繪病灶邊界。應用情境：MRI 腦腫瘤的精確輪廓標記（供放射治療計劃使用）、CT 的器官自動分割（供手術規劃使用）。

第 2 題： AlphaFold 2 解決了蛋白質折疊問題（Protein Folding Problem），預測蛋白質從一維胺基酸序列折疊成三維結構的方式。輸入：蛋白質的胺基酸序列（一串字母代碼）；輸出：蛋白質的三維原子坐標結構。對藥物發現的意義：藥物通常需要與特定蛋白質（靶點）結合，了解蛋白質的三維形狀是設計藥物分子的前提。過去確定一個蛋白質結構需要數年實驗；AlphaFold 讓研究者能在幾分鐘內取得數百萬種蛋白質的結構，大幅加速靶點識別與藥物設計。

第 3 題：(B) 聯邦學習的核心原則是「資料不動、模型動」。各醫院在本地用自己的資料訓練模型，只將訓練產生的模型梯度（而非原始病患資料）上傳至中央伺服器，由伺服器使用 FedAvg 等演算法聚合梯度，更新全域模型，再下發給各醫院。選項 (A) 是傳統集中式學習，違反資料隱私；(C) 描述的是資料加密傳輸，非聯邦學習；(D) 是直接複製模型，不涉及協同訓練。

第 4 題： 原因分析：訓練資料幾乎全為白種人患者，導致模型學到的特徵（如皮膚底色、黑色素分布）偏向白種人特徵。當部署到深色皮膚的東南亞患者時，模型遇到訓練分布之外的資料，偏見被放大，準確率下滑。這是訓練資料代表性不足（Underrepresentation Bias）的典型案例。改善方案：①納入不同膚色、不同族群的患者影像重新訓練，確保資料多樣性；②對現有模型進行針對東南亞族群資料的遷移學習（Transfer Learning）微調；③部署後持續監控不同族群子群的模型效能，及早發現效能差異。

第 5 題：

臨床信任：醫師的職責是對患者的治療決策負責。若 AI 說「這是惡性腫瘤」但無法解釋依據，醫師無從判斷 AI 是否可信，更無法在 AI 出錯時及時糾正。可解釋性讓醫師能驗證 AI 的推理邏輯（例如透過 Grad-CAM 確認 AI 確實在看腫瘤區域，而非背景雜訊），才能建立信任並安全使用。
法律責任：當治療結果不佳時，醫師必須能向患者、家屬甚至法院說明治療決策的理由。若採納了一個「黑箱」AI 的建議，醫師無法解釋依據，法律責任將難以釐清。相比之下，廣告推薦 AI 推錯廣告頂多降低點擊率，不涉及人身安全與法律責任，因此可解釋性要求相對寬鬆。