一、學習目標
完成本單元後,你將能夠:
- 說明醫療業導入 AI 的迫切背景與結構性需求
- 描述 CNN 與 U-Net 在醫學影像診斷中的應用方式
- 理解臨床 NLP 如何處理病歷資料與醫療編碼
- 解釋 AI 如何加速藥物發現並介紹 AlphaFold 的意義
- 說明精準醫療(Precision Medicine)的核心概念
- 掌握遠距健康監測的 AI 技術架構
- 理解醫療 AI 的特有挑戰:隱私、可解釋性、法規審查
- 說明聯邦學習(Federated Learning)在醫療場域的重要性
二、核心內容
2-1 醫療業為何迫切需要 AI?
生活比喻:一位資深放射科醫師每天要判讀數百張影像,相當於一個人要同時讀完數十本書並逐字找錯——體力與注意力的極限終將到來,AI 就是那個永不疲倦的助手。
醫療 AI 的需求來自三個結構性壓力:
1. 全球醫師短缺與高齡化浪潮 世界衛生組織估計,2030 年全球將短缺 1,000 萬名醫護人員。同時,高齡化社會帶來更龐大的診療需求,人力供需缺口不斷擴大。
2. 醫療資料的爆炸性成長 每位患者一生產生的健康資料(影像、基因組、電子病歷、穿戴裝置數據)已超過人類醫師能夠全面消化的範圍。AI 能從海量資料中萃取人眼難以察覺的模式。
3. 精準化診療的需求 傳統醫學是「平均人」醫學——同樣的藥對不同基因型的患者效果可能天差地別。AI 結合基因組資料,讓「為每個人量身訂製的治療方案」成為可能。
2-2 應用一:醫學影像診斷(Medical Imaging)
生活比喻:教一個醫學生看 X 光需要幾年;AI 模型「看」了百萬張有標籤的影像後,準確率可達資深放射科醫師水準——而且永遠不會因為值班太久而分心。
核心技術
① CNN(Convolutional Neural Network,卷積神經網路) CNN 是醫學影像分析的主力模型,擅長從像素矩陣中識別局部特徵(邊緣、紋理、形狀),進而判斷影像中是否存在腫瘤、出血、骨折等異常。
- X 光:肺炎偵測、骨折識別、胸腔異常篩查
- CT 掃描:肺結節偵測、腦出血判讀、冠狀動脈狹窄評估
- MRI:腦腫瘤分割、脊椎病變分析
- 病理切片(Pathology):癌細胞分類、病理分期判定
② U-Net(語意分割模型) U-Net 是醫學影像**分割(Segmentation)**的標準架構,能精確標記出病灶的輪廓範圍(例如腫瘤的確切邊界),而不只是分類「有沒有腫瘤」。
輸入:MRI 腦部影像
↓ U-Net 語意分割
輸出:腫瘤區域精確輪廓(像素級標記)
↓ 臨床應用
放療計劃:精確定義照射範圍,減少對正常組織的傷害
FDA 核准的 AI 醫療器材(AI-Enabled Medical Devices)
美國食品藥物管理局(FDA)已核准超過 500 項 AI/ML 醫療器材,主要集中於放射科(Radiology)與心臟科(Cardiology)。知名案例包括 Google DeepMind 的眼底影像糖尿病視網膜病變篩查系統(準確率達眼科醫師水準)。
核心挑戰:罕見疾病的資料稀缺性
| 挑戰 | 說明 |
|---|---|
| 資料量不足 | 罕見疾病案例少,難以蒐集足夠的標注訓練資料 |
| 標注成本極高 | 每張影像需要專科醫師標注,時間與費用昂貴 |
| 跨院資料差異 | 不同廠牌的 CT/MRI 設備產出影像風格不同,模型泛化能力受限 |
| 解決方向 | 遷移學習(Transfer Learning)、合成資料生成(GAN)、聯邦學習(Federated Learning) |
2-3 應用二:臨床 NLP 與病歷摘要(Clinical NLP)
生活比喻:醫師每天要翻閱數十份厚重病歷,從中找出關鍵資訊——AI 就像一個精準的閱讀助理,能在數秒內摘要出最重要的內容。
BERT 在醫療場域的應用
通用 BERT 模型在醫療文本上效果有限,因此出現了專門用醫療文獻預訓練的版本:
| 模型 | 預訓練資料 | 應用 |
|---|---|---|
| BioBERT | PubMed 醫學論文 | 醫學文獻挖掘、關係抽取 |
| ClinicalBERT | 電子病歷(EHR) | 病歷摘要、再入院預測 |
| Med-PaLM(Google) | 醫療知識 + RLHF | 回答醫學問題 |
ICD 編碼自動化
ICD(International Classification of Diseases,國際疾病分類碼)是全球醫院用來記錄診斷的標準編碼系統(如 J18.9 = 肺炎)。傳統上由醫療編碼員人工對照,AI 可透過 NLP 自動從病歷文字中識別並指派正確的 ICD 碼,大幅節省行政人力。
核心挑戰
- 醫療術語複雜性:縮寫歧義(如「PT」可能指 Patient、Physical Therapy 或 Prothrombin Time)
- 資料隱私:病歷含高度敏感個人資訊,資料共享受《個人資料保護法》及 HIPAA 嚴格限制
- 非結構化資料比例高:超過 80% 的醫療資訊存在於自由文字(醫師手寫的問診紀錄)中
2-4 應用三:AI 加速藥物發現(Drug Discovery)
生活比喻:傳統藥物開發像在大海中撈針——數百萬種化合物中找出對疾病有效且安全的那一顆。AI 讓這個過程從隨機撈針,變成有系統的精準搜索。
傳統 vs. AI 驅動的藥物開發
| 階段 | 傳統方式 | AI 輔助 |
|---|---|---|
| 靶點識別 | 人工文獻回顧 | NLP 挖掘論文、知識圖譜 |
| 化合物篩選 | 高通量實驗室篩選(HTS) | AI 預測分子活性,減少實驗次數 |
| 藥物設計 | 化學家設計合成路徑 | 生成模型(VAE、GAN)生成候選分子 |
| 毒性預測 | 動物實驗 | AI 預測 ADMET 性質 |
| 臨床試驗 | 人工篩選受試者 | AI 比對基因型匹配最適受試族群 |
整體開發週期:傳統超過 10 年、耗資逾 10 億美元;AI 輔助有望縮短至 4-6 年。
AlphaFold:蛋白質結構預測的里程碑
2021 年,DeepMind 的 AlphaFold 2 解決了分子生物學長達 50 年的難題——蛋白質折疊問題(Protein Folding Problem):僅憑胺基酸序列,精準預測蛋白質的三維結構。
生活比喻:蛋白質就像一條長項鍊,會自動折疊成特定形狀來執行功能。以前科學家要用 X 射線結晶學花費數年才能確定形狀;AlphaFold 在幾分鐘內就能預測出來,準確率媲美實驗室。
AlphaFold 已預測超過 2 億個蛋白質結構,開放全球研究者免費使用,被視為近年來最重要的 AI 科學突破之一。
圖神經網路(GNN)在藥物化學中的應用
分子結構天然是圖結構(原子 = 節點,化學鍵 = 邊),GNN 能直接在分子圖上學習,預測藥物的:
- 與靶蛋白的結合親和力(Binding Affinity)
- 藥物毒性(Toxicity)
- 藥物交互作用(Drug-Drug Interaction)
2-5 應用四:精準醫療(Precision Medicine)
生活比喻:傳統醫療就像給全班同學穿同一尺寸的衣服;精準醫療是為每個人量身裁製——根據你獨特的基因型、生活習慣、病史,設計最適合你的治療方案。
基因組學 + AI 的整合
- 基因型預測治療反應:特定基因變異(如 BRCA1 突變)決定乳癌治療方案
- 生物標記(Biomarker)預測:AI 從基因表達資料中識別預測預後的生物標記
- 癌症亞型分類:同樣叫做「肺癌」的疾病可能有數十種基因型亞型,治療策略大不同
台灣精準醫療案例
台灣人體生物資料庫(Taiwan Biobank)收集超過 15 萬名參與者的基因與健康資料,結合健保資料庫,成為全球最具規模的精準醫療研究資源之一,已支援多項 AI 研究計劃。
2-6 應用五:遠距健康監測(Remote Health Monitoring)
生活比喻:過去只有在醫院量血壓才算「有紀錄」;現在你手腕上的智慧手錶每分鐘都在監測心率,AI 持續分析這些資料,在問題發生前就發出預警。
技術架構:穿戴裝置 + IoT + AI
穿戴裝置(Apple Watch / 連續血糖監測儀 / 智慧床墊)
↓ 即時感測資料(心率、SpO2、血壓、睡眠)
IoT 閘道器(Edge Computing 初步過濾)
↓ 結構化時序資料
AI 分析引擎(雲端或邊緣推論)
↓ 異常偵測 / 早期預警
├→ 通知患者 App
└→ 警示醫療團隊 / 家屬
高齡照護中的關鍵應用
| 應用 | 技術 | 效益 |
|---|---|---|
| 跌倒偵測 | 加速度計 + 分類模型 | 第一時間通知家屬與緊急服務 |
| 心房顫動偵測 | Apple Watch ECG + CNN | 早期發現中風高風險 |
| 睡眠呼吸中止症篩查 | 麥克風 + 呼吸感測 + AI | 居家篩查,減少睡眠檢查等候時間 |
| 糖尿病管理 | 連續血糖監測 + RL 胰島素幫浦 | 自動調整胰島素劑量 |
| 失智症早期預警 | 行為模式 AI 分析 | 從日常活動變化偵測認知衰退 |
2-7 醫療 AI 的特有挑戰
① 資料隱私:HIPAA 與台灣個資法
醫療資料是最敏感的個人資料,受到嚴格法律保護:
- 美國 HIPAA(健康保險可攜性和責任法案):規定醫療資料的使用、存儲、傳輸標準
- 台灣《個人資料保護法》:病歷屬於特種個人資料,原則上禁止處理,須取得明確同意
② 模型可解釋性與臨床信任
醫師在決定是否採納 AI 建議時,需要知道「為什麼」,而不只是「答案是什麼」。一個說「這顆腫瘤是惡性的,機率 87%」的模型,若無法解釋依據,醫師難以對患者交代,法律責任也無從釐清。
可解釋性工具:Grad-CAM(Gradient-weighted Class Activation Mapping)——在影像上以熱力圖標示出模型做出決策的「關注區域」,讓醫師看到 AI 是否真的在看「對的地方」。
③ 監管審查與上市許可
AI 醫療器材必須通過嚴格的臨床驗證才能上市:
- 美國 FDA:510(k) 或 De Novo 途徑審查
- 台灣 TFDA(食品藥物管理署):AI 醫療器材需提交臨床效能報告
- 模型更新後是否需要重新申請許可?FDA 已提出「預定變更控制計劃(PCCP)」框架應對此挑戰
④ 臨床資料的偏見問題
歷史醫療資料常有系統性偏見:
- 訓練資料大多來自大型教學醫院,對農村患者或特定族裔的代表性不足
- 若 AI 皮膚癌偵測模型主要用白種人皮膚訓練,在深色皮膚上的準確率可能顯著下降
2-8 聯邦學習(Federated Learning):醫院之間如何安全共享 AI?
生活比喻:你想讓十家醫院的 AI 集體變聰明,但每家醫院的病人資料都不能外流——聯邦學習的解法是:「讓模型出門旅行,不讓資料離家。」
傳統方式的困境
將多家醫院的病歷集中到同一台伺服器訓練,雖然能獲得最多資料,但違反《個資法》和醫院間的保密協議,在實務上幾乎不可能實現。
聯邦學習的運作方式
中央伺服器(協調者)
↓ 下發初始模型
醫院 A 醫院 B 醫院 C
(本地訓練) (本地訓練) (本地訓練)
↓ ↓ ↓
上傳模型梯度(非原始資料)
↓
中央伺服器聚合梯度(FedAvg 演算法)
↓
更新後的全域模型再下發給各醫院
- 資料不離院:各醫院只上傳模型更新(梯度),原始病患資料留在院內
- 集體智慧:最終模型受益於所有醫院的資料多樣性,泛化能力更強
- 差分隱私(Differential Privacy):在梯度中加入雜訊,進一步防止從梯度反推原始資料
三、關鍵名詞中英對照
| 中文 | 英文 |
|---|---|
| 醫學影像 | Medical Imaging |
| 卷積神經網路 | Convolutional Neural Network (CNN) |
| 語意分割 | Semantic Segmentation |
| 蛋白質折疊 | Protein Folding |
| 圖神經網路 | Graph Neural Network (GNN) |
| 精準醫療 | Precision Medicine |
| 生物標記 | Biomarker |
| 基因組學 | Genomics |
| 電子病歷 | Electronic Health Record (EHR) |
| 遠距健康監測 | Remote Health Monitoring |
| 穿戴裝置 | Wearable Device |
| 聯邦學習 | Federated Learning |
| 差分隱私 | Differential Privacy |
| 國際疾病分類碼 | ICD (International Classification of Diseases) |
| 梯度 | Gradient |
| 遷移學習 | Transfer Learning |
| 可解釋 AI | Explainable AI (XAI) |
| 熱力圖 | Heatmap / Grad-CAM |
| 藥物發現 | Drug Discovery |
| 高通量篩選 | High-Throughput Screening (HTS) |
| 健康保險可攜性和責任法案 | HIPAA (Health Insurance Portability and Accountability Act) |
| 邊緣運算 | Edge Computing |
| 心房顫動 | Atrial Fibrillation |
四、考試重點提示
重點 1:醫學影像的核心技術 CNN 用於影像分類(有沒有病灶),U-Net 用於影像分割(病灶的精確輪廓)。考試常考這兩者的差異與應用情境。
重點 2:AlphaFold 的歷史意義 AlphaFold 2 解決了長達 50 年的蛋白質折疊問題,能從胺基酸序列預測蛋白質三維結構,已預測超過 2 億個蛋白質,大幅加速藥物發現。這是近年最常被考的 AI 科學突破案例之一。
重點 3:聯邦學習解決醫療資料隱私問題 醫療資料無法集中,聯邦學習讓「模型到各院訓練,只傳梯度不傳資料」。考試重點:資料不離院、上傳梯度(非原始資料)、FedAvg 演算法聚合、差分隱私加雜訊保護。
重點 4:醫療 AI 四大挑戰 資料隱私(HIPAA/個資法)、模型可解釋性(臨床信任)、法規審查(FDA/TFDA)、訓練資料偏見(族群代表性不足)。這四點是醫療 AI 有別於其他產業 AI 的特殊障礙。
重點 5:精準醫療 vs. 傳統醫療 傳統醫療是「平均人」模型,精準醫療結合基因組資料為每位患者量身定制治療方案。台灣人體生物資料庫是重要的本土案例。
1. U-Net 與一般 CNN 分類模型在醫學影像任務上的主要差異是什麼?請各舉一個適合的應用情境說明。
2. AlphaFold 2 解決了什麼科學難題?它的輸入和輸出各是什麼?為何這對藥物發現有重大意義?
3. 以下哪項描述最能說明聯邦學習(Federated Learning)的核心原理?
- (A) 將所有醫院的病患資料集中到同一台伺服器進行統一訓練
- (B) 各醫院在本地訓練模型,只將模型梯度上傳至中央伺服器聚合
- (C) 使用資料加密技術,讓各醫院的資料可以安全地跨院傳輸
- (D) 由一家醫院訓練好模型後,直接複製給其他醫院使用
4. 一個皮膚癌 AI 診斷模型,訓練資料幾乎全來自白種人患者。這個模型部署到東南亞醫院後,準確率顯著下降。請從「資料偏見」角度分析原因,並提出一個改善方案。
5. 醫療 AI 對「模型可解釋性」的要求,為何比一般商業 AI(如廣告推薦)更嚴格?請從臨床信任與法律責任兩個角度說明。
解答與解析
| 題號 | 答案 |
|---|---|
| 1 | CNN 做影像分類(有無病灶);U-Net 做像素級分割(病灶精確輪廓) |
| 2 | 蛋白質折疊問題;輸入胺基酸序列,輸出三維結構;加速靶點識別與藥物設計 |
| 3 | (B) |
| 4 | 訓練資料族群代表性不足;改善方案:納入多元族群資料重新訓練,或使用遷移學習微調 |
| 5 | 醫療決策影響患者生命安全,醫師需理解依據;法律上醫師須對患者說明治療理由,黑箱模型無法承擔責任 |
詳細解析:
第 1 題:
- CNN 分類模型:輸出是整張影像的標籤(如「此 X 光有肺炎 / 沒有肺炎」),適合篩查任務。應用情境:胸腔 X 光的肺炎分類、眼底影像的糖尿病視網膜病變有無判斷。
- U-Net 分割模型:輸出是每個像素的類別標籤,能精確描繪病灶邊界。應用情境:MRI 腦腫瘤的精確輪廓標記(供放射治療計劃使用)、CT 的器官自動分割(供手術規劃使用)。
第 2 題: AlphaFold 2 解決了蛋白質折疊問題(Protein Folding Problem)——預測蛋白質從一維胺基酸序列折疊成三維結構的方式。輸入:蛋白質的胺基酸序列(一串字母代碼);輸出:蛋白質的三維原子坐標結構。對藥物發現的意義:藥物通常需要與特定蛋白質(靶點)結合,了解蛋白質的三維形狀是設計藥物分子的前提。過去確定一個蛋白質結構需要數年實驗;AlphaFold 讓研究者能在幾分鐘內取得數百萬種蛋白質的結構,大幅加速靶點識別與藥物設計。
第 3 題:(B) 聯邦學習的核心原則是「資料不動、模型動」。各醫院在本地用自己的資料訓練模型,只將訓練產生的模型梯度(而非原始病患資料)上傳至中央伺服器,由伺服器使用 FedAvg 等演算法聚合梯度,更新全域模型,再下發給各醫院。選項 (A) 是傳統集中式學習,違反資料隱私;(C) 描述的是資料加密傳輸,非聯邦學習;(D) 是直接複製模型,不涉及協同訓練。
第 4 題: 原因分析:訓練資料幾乎全為白種人患者,導致模型學到的特徵(如皮膚底色、黑色素分布)偏向白種人特徵。當部署到深色皮膚的東南亞患者時,模型遇到訓練分布之外的資料,偏見被放大,準確率下滑。這是訓練資料代表性不足(Underrepresentation Bias)的典型案例。改善方案:①納入不同膚色、不同族群的患者影像重新訓練,確保資料多樣性;②對現有模型進行針對東南亞族群資料的遷移學習(Transfer Learning)微調;③部署後持續監控不同族群子群的模型效能,及早發現效能差異。
第 5 題:
- 臨床信任:醫師的職責是對患者的治療決策負責。若 AI 說「這是惡性腫瘤」但無法解釋依據,醫師無從判斷 AI 是否可信,更無法在 AI 出錯時及時糾正。可解釋性讓醫師能驗證 AI 的推理邏輯(例如透過 Grad-CAM 確認 AI 確實在看腫瘤區域,而非背景雜訊),才能建立信任並安全使用。
- 法律責任:當治療結果不佳時,醫師必須能向患者、家屬甚至法院說明治療決策的理由。若採納了一個「黑箱」AI 的建議,醫師無法解釋依據,法律責任將難以釐清。相比之下,廣告推薦 AI 推錯廣告頂多降低點擊率,不涉及人身安全與法律責任,因此可解釋性要求相對寬鬆。