一、學習目標
- 理解**自適應學習(Adaptive Learning)**的 RL 技術基礎與個人化路徑設計原理
- 掌握 NLP 在**自動評分(Auto-grading)與智慧導師系統(Intelligent Tutoring System)**中的應用
- 說明 AI 在公部門服務的四大場景:智慧客服、語音轉錄、文件自動化、交通管理
- 了解台灣數位部公部門 AI 應用參考手冊六大治理維度
- 識別教育與公部門 AI 導入的四大挑戰:數位落差、隱私、公眾信任、透明性
二、核心內容
2.1 教育 × AI 的變革全景
傳統教育面臨的核心困境是「一對多」——同一位老師、同一份教材、同一套評量,卻要服務學習速度、背景知識、興趣方向截然不同的學生。AI 的出現讓「個人化教育(Personalized Education)」從理想變為可行。
生活類比:
傳統課堂像集體搭公車:固定路線、固定時刻,不管你住哪裡都要走到站牌等車。AI 教育更像叫 Uber:系統知道你在哪、要去哪,幫你規劃最適合你的路線,甚至在你繞錯路時即時重新導航。
教育 AI 五大應用:
| 應用 | AI 技術 | 核心價值 |
|---|---|---|
| 自適應學習(Adaptive Learning) | 強化學習(RL)、知識圖譜 | 為每位學生生成個人化學習路徑 |
| 自動評分(Auto-grading) | NLP、BERT、GPT | 作文、申論自動評分,減輕教師負擔 |
| 智慧導師系統(Intelligent Tutoring System) | 對話式 AI、RAG | 7×24 小時個人化輔導,如 Khanmigo |
| 自動出題(Question Generation) | NLP、文字摘要 | 從教材自動生成練習題與測驗 |
| AI 內容偵測(AI Content Detection) | 分類模型、困惑度分析 | 偵測學生作業是否由 AI 代寫 |
2.2 教育 AI 應用一:自適應學習(Adaptive Learning)
自適應學習是指系統根據學生的即時表現與學習歷程,動態調整學習內容的難度、順序與形式,為每位學生生成最優的個人化學習路徑。
生活類比:
自適應學習就像一位有耐心、記憶力無限好的私人家教:你做對了,題目馬上變難;你卡關了,系統知道是哪個前置概念沒學好,帶你回頭補強,而不是把同一道題再念一遍給你聽。
技術架構:
| 技術元件 | 功能 |
|---|---|
| 知識圖譜(Knowledge Graph) | 描述各概念之間的前提與依賴關係(先學加法,才能學乘法) |
| 學生模型(Student Model) | 追蹤每位學生對每個知識點的掌握程度(掌握度 0~100%) |
| RL 路徑規劃(RL Path Planning) | 以最大化學習效率為目標,選擇下一個最適合的學習內容 |
| 內容推薦引擎 | 根據路徑規劃,從題庫中選出最合適的題型與難度 |
RL 在自適應學習中的運作:
| RL 元件 | 在學習系統中的對應 |
|---|---|
| 狀態(State) | 學生當前的知識掌握圖譜、最近答題紀錄、疲勞程度 |
| 動作(Action) | 下一題的知識點、難度等級、題型(選擇 / 填充 / 申論) |
| 獎勵(Reward) | 學生進步速度、長期留存率、最終測驗分數 |
考試重點:自適應學習的核心技術是知識圖譜 + 學生模型 + RL 路徑規劃三者的整合。RL 的獎勵函數設計直接影響系統行為——若只獎勵短期答對率,系統會讓學生一直做簡單題;加入長期學習效果指標才能真正提升學習成效。
2.3 教育 AI 應用二:自動評分(Auto-grading)
自動評分從最初的選擇題批改,已進化到 NLP 驅動的作文自動評分(Automated Essay Scoring, AES)。
| 評分類型 | 技術 | 成熟度 |
|---|---|---|
| 選擇 / 填充題 | 規則比對 | 非常成熟,已廣泛使用 |
| 程式碼作業 | 執行測試 + 程式碼分析 | 成熟,LeetCode 等平台廣泛使用 |
| 短答題 / 申論 | BERT 語意相似度、GPT 評分 | 進步中,仍需人工校驗 |
| 作文(整體品質) | 多維度 NLP(語法、連貫性、論證結構) | 大學入學考試已試用,存在爭議 |
作文自動評分的評估維度:
| 維度 | 說明 |
|---|---|
| 語法正確性(Grammar) | 語法錯誤數量與類型 |
| 詞彙豐富度(Vocabulary) | 詞彙多樣性、進階詞彙使用頻率 |
| 論證連貫性(Coherence) | 段落邏輯、主題一致性 |
| 論點深度(Argumentation) | 論述是否有具體佐證、反駁與結論 |
生活類比:
AI 評分老師不怕疲勞、不因為字醜扣分、不因為認識這位學生而有偏心——但它也看不懂「這個學生的比喻很有創意」「這段文字雖然不合語法但充滿詩意」。AI 評分最適合客觀維度,主觀創意仍需人類判斷。
2.4 教育 AI 應用三:智慧導師系統(Intelligent Tutoring System)
**智慧導師系統(ITS)**是能夠與學生進行對話互動、提供個人化解題指導的 AI 系統。
**Khanmigo(Khan Academy 的 AI 導師)**是目前最具代表性的產品:
| 功能 | 說明 |
|---|---|
| 蘇格拉底式引導 | 不直接給答案,透過引導式問題幫學生自己找到解法 |
| 即時錯誤分析 | 識別學生的具體錯誤類型(如混淆加減符號),針對性糾正 |
| 情境解釋 | 將抽象概念與生活情境連結,提升理解 |
| 7×24 可用 | 不受時間限制,學生隨時可獲得輔導 |
技術基礎:大型語言模型(LLM)+ RAG(從課程知識庫檢索)+ 對話狀態管理
2.5 教育 AI 應用四:自動出題(Question Generation)
**自動出題(Automatic Question Generation, AQG)**技術從文章或教材中自動生成各類題目:
[輸入教材文本] → [NLP 重點萃取] → [題型模板填充] → [干擾選項生成] → [輸出試題]
↑
(錯誤選項需夠「迷惑性」,
常用反義詞、相似概念填充)
| 應用場景 | 說明 |
|---|---|
| 教師備課 | 從教科書章節自動生成練習題,教師審核後使用 |
| 線上學習平台 | 無限生成練習題,避免學生背答案 |
| 複習系統 | 根據學生弱點知識點,針對性生成加強練習 |
2.6 教育 AI 應用五:AI 內容偵測(AI Content Detection)
隨著生成式 AI 普及,偵測學生作業是否由 AI 代寫成為教育機構的新挑戰。
| 偵測方法 | 原理 | 限制 |
|---|---|---|
| 困惑度分析(Perplexity Analysis) | AI 生成的文字往往「太流暢」,困惑度(Perplexity)偏低 | 高水準人類寫作也可能低困惑度 |
| 寫作風格比對(Stylometry) | 與學生過去的寫作風格比較,偵測風格突變 | 需要足夠的歷史寫作樣本 |
| 分類模型(Classification) | 訓練二元分類器區分人類 vs. AI 生成文字 | 新版 AI 模型出現後需頻繁更新 |
考試重點:AI 內容偵測工具(如 GPTZero、Turnitin AI Detector)的核心原理是困惑度(Perplexity)——AI 生成文字的 Perplexity 通常低於人類寫作,因為 AI 傾向選擇「最可能的下一個詞」,生成極為流暢但缺乏個人風格的文字。
2.7 公部門 AI 應用一:智慧客服(Smart Customer Service)
台灣財政部智慧客服是公部門 AI 導入的代表性案例:系統整合稅務常見問答、報稅流程指引、申報書類下載等資訊,民眾透過網頁聊天介面即可獲得 24 小時服務,大幅降低電話服務中心的人工負荷。
NLP 智慧客服技術架構:
[民眾輸入問題] → [意圖識別(Intent Classification)]
↓
[知識庫查詢(FAQ Retrieval / RAG)]
↓
[回應生成(Template / LLM Generation)]
↓
[信心評分] → [高信心:直接回覆] / [低信心:轉人工客服]
| 技術元件 | 說明 |
|---|---|
| 意圖識別(Intent Classification) | 判斷民眾問的是「報稅截止日」還是「退稅進度」 |
| 實體擷取(Named Entity Recognition) | 從問題中擷取關鍵資訊(如「統一編號」「稅籍地址」) |
| 知識庫 RAG | 從官方文件中檢索正確答案,減少幻覺風險 |
| 人工升級機制(Human Escalation) | 複雜或敏感問題自動轉接真人客服 |
2.8 公部門 AI 應用二:法院語音轉錄(Court Speech-to-Text)
台灣司法院語音辨識系統將法庭錄音即時轉為文字,取代人工速記,顯著提升書記效率與紀錄準確性。
生活類比:
過去的法庭速記員就像在音樂會上靠手寫記下整首曲子的音符——速度與準確性受限於人的生理極限。AI 語音辨識系統像一台精準的音樂錄製機,不疲勞、不遺漏,還能即時輸出文字稿供法官確認。
語音辨識在公部門的技術挑戰:
| 挑戰 | 說明 | 對策 |
|---|---|---|
| 專業術語(Legal Jargon) | 法律用語、訴訟程序術語與通用語音模型訓練資料差異大 | 以司法文書微調(Fine-tuning)專用模型 |
| 多人同時說話 | 法庭審判中律師、法官、證人交叉發言 | 說話者分離(Speaker Diarization)技術 |
| 台灣口音與台語夾雜 | 民眾陳述可能夾雜台語或地方口音 | 本地化訓練資料增強 |
| 資料安全(Data Security) | 法庭錄音含高度敏感資訊 | 嚴格的存取控制與本地部署 |
2.9 公部門 AI 應用三:文件處理自動化(Document Processing Automation)
政府機關每日處理大量的書面申請、公文與報表。AI 文件處理自動化能大幅降低人工作業負擔:
| 技術 | 應用場景 |
|---|---|
| OCR + NLP | 掃描紙本申請書,自動擷取關鍵欄位資訊 |
| 文件分類(Document Classification) | 自動將公文分類至對應承辦單位 |
| 資訊擷取(Information Extraction) | 從合約或申報書中自動萃取關鍵條款與數據 |
| 審核輔助(Review Assistance) | AI 預審申請書完整性,標記缺件或格式錯誤 |
2.10 公部門 AI 應用四:交通管理與災害預測
智慧交通(Smart Traffic Management):
| 應用 | AI 技術 | 效益 |
|---|---|---|
| 號誌時相動態調整 | 強化學習、電腦視覺車流偵測 | 減少路口等候時間 15~30% |
| 違規行為偵測 | 電腦視覺(闖紅燈、超速) | 自動開單,減少執法人力 |
| 停車場導引 | 影像辨識車牌 + 即時空位預測 | 減少繞駛尋位的碳排放 |
災害預測(Disaster Prediction):
| 災害類型 | AI 技術 | 資料來源 |
|---|---|---|
| 洪水預測 | LSTM 時間序列模型 | 雨量站、河川水位感測器 |
| 地震早期預警 | 深度學習地震波形分析 | 地震儀網絡即時資料 |
| 山坡地崩塌 | 衛星影像變化偵測 + 降雨資料 | 遙測衛星、氣象資料 |
2.11 台灣脈絡:數位部公部門 AI 應用參考手冊六大治理維度
台灣數位部發布的《公部門 AI 應用參考手冊》,從六個維度提供 AI 治理框架:
| 治理維度 | 核心內容 |
|---|---|
| 1. 合法性(Legality) | AI 系統的資料蒐集、處理須符合個資法與相關法規授權 |
| 2. 公平性(Fairness) | 避免 AI 決策系統對特定族群產生系統性歧視 |
| 3. 透明性(Transparency) | 重要決策的 AI 運作邏輯需能向民眾說明(可解釋性) |
| 4. 安全性(Security) | 資料安全、系統韌性、防範惡意攻擊 |
| 5. 問責性(Accountability) | 明確 AI 決策的責任歸屬,建立申訴與覆核機制 |
| 6. 人本性(Human-centricity) | 維持人工審查的最終決定權,AI 為輔而非取代 |
考試重點:數位部六大治理維度的英文名稱與核心意涵是 iPAS 考試高頻考點。其中**問責性(Accountability)**強調「AI 錯了,誰負責」;**透明性(Transparency)**強調「民眾有權知道 AI 如何做決定」。
2.12 四大導入挑戰
挑戰一:數位落差(Digital Divide)
生活類比:
AI 教學平台讓台北資源豐富學校的學生如虎添翼,但偏遠地區學生連穩定網路都缺乏——AI 有可能拉大而非縮小教育不平等。
| 層面 | 問題 | 對策 |
|---|---|---|
| 設備落差 | 低收入學生缺乏裝置存取 AI 工具 | 政府補助設備與寬頻網路 |
| 能力落差 | 教師缺乏 AI 工具使用技能 | 師培課程加入 AI 素養模組 |
| 語言落差 | AI 工具多以英語訓練,中文效果次等 | 優先採用本地化中文 AI 系統 |
挑戰二:隱私(Privacy)
教育與公部門的 AI 系統處理大量高度敏感資料:
| 資料類型 | 敏感性 | 法規保護 |
|---|---|---|
| 學生學習行為紀錄 | 高(涉及未成年人) | 兒童線上隱私保護法規 |
| 政府服務申請資料 | 極高(含個人識別與財務資訊) | 個人資料保護法 |
| 法庭錄音 | 極高(含被告、證人機密陳述) | 司法程序保密規定 |
挑戰三:公眾信任(Public Trust)
民眾對政府 AI 系統天生存有更高的疑慮:「為什麼 AI 決定我的補助申請被拒絕?」「AI 有沒有種族偏見?」。重建信任的關鍵:
- 可解釋性(Explainability):提供決策理由,而非黑箱輸出
- 申訴機制(Appeal Mechanism):讓民眾能對 AI 決策提出異議並由人工複審
- 定期稽核(Regular Auditing):公開發布 AI 系統的公平性評估報告
挑戰四:透明性要求(Transparency Requirements)
政府機關的 AI 系統比企業 AI 面臨更嚴格的透明度要求——因為其決策影響公民權益(補助、執照、刑事判決),必須能接受公眾與司法審查:
| 透明性要求 | 說明 |
|---|---|
| 演算法揭露 | 高風險決策的 AI 模型邏輯需對外說明 |
| 資料來源揭露 | 訓練資料的範圍、品質與代表性需公開 |
| 決策日誌(Audit Log) | 每次 AI 決策的輸入、輸出與版本需可追溯 |
三、關鍵名詞中英對照
| 中文 | 英文 | 說明 |
|---|---|---|
| 自適應學習 | Adaptive Learning | 根據學生表現動態調整學習內容的個人化教育系統 |
| 個人化教育 | Personalized Education | 依據個別學生需求量身設計的學習體驗 |
| 知識圖譜 | Knowledge Graph | 描述概念間前提與依賴關係的結構化知識表示 |
| 學生模型 | Student Model | 追蹤學生對各知識點掌握程度的動態模型 |
| 智慧導師系統 | Intelligent Tutoring System (ITS) | 能進行個人化對話指導的 AI 教育系統 |
| 自動評分 | Auto-grading / Automated Essay Scoring (AES) | AI 自動批改作業與作文的技術 |
| 自動出題 | Automatic Question Generation (AQG) | 從教材自動生成練習題的 NLP 技術 |
| 困惑度 | Perplexity | 語言模型對文字的預測不確定性,AI 生成文字通常困惑度較低 |
| 意圖識別 | Intent Classification | 判斷用戶訊息背後目的的 NLP 分類任務 |
| 實體擷取 | Named Entity Recognition (NER) | 從文字中識別並擷取特定類型資訊(人名、地名、金額等) |
| 說話者分離 | Speaker Diarization | 從多人錄音中識別並區分不同說話者的技術 |
| 數位落差 | Digital Divide | 不同族群在數位技術存取能力上的差距 |
| 可解釋性 | Explainability | AI 系統能向人類說明其決策理由的能力 |
| 問責性 | Accountability | 明確 AI 決策錯誤時的責任歸屬機制 |
| 透明性 | Transparency | AI 系統運作邏輯與資料使用方式的公開程度 |
| 人本性 | Human-centricity | 以人類福祉為核心、維持人工最終決定權的設計原則 |
| 人工升級機制 | Human Escalation | 當 AI 信心不足時,自動將對話轉接給真人處理的機制 |
| 決策日誌 | Audit Log | 記錄 AI 每次決策的輸入輸出與版本,供事後稽核 |
| 智慧城市 | Smart City | 運用 AI 與 IoT 提升城市基礎建設與公共服務效率的概念 |
| 公平性 | Fairness | AI 決策在不同族群間無系統性歧視的特性 |
四、考試重點提示
考試重點:**自適應學習(Adaptive Learning)**的三核心元件——知識圖譜(概念前提關係)、學生模型(掌握度追蹤)、RL 路徑規劃(最優學習序列)。考試常問「RL 在自適應學習中的狀態/動作/獎勵分別是什麼」。
考試重點:**困惑度(Perplexity)**是 AI 生成文字偵測的核心指標——AI 生成文字困惑度偏低,因為模型傾向選擇「最可能的詞」。困惑度越低,越可能是 AI 生成;越高,越可能是有個人風格的人類寫作。
考試重點:數位部六大治理維度:合法性、公平性、透明性、安全性、問責性、人本性。其中問責性(誰負責)與透明性(為何如此決定)是公部門 AI 特有的高標準要求,在企業 AI 中相對寬鬆。
考試重點:財政部智慧客服的 NLP 架構核心流程——意圖識別 → 知識庫查詢 → 信心評分 → 高信心直接回覆 / 低信心轉人工。「人工升級機制(Human Escalation)」是政府 AI 客服的必要設計,確保複雜案件有人負責。
考試重點:司法院語音辨識的三大挑戰——專業術語、多人同時說話(說話者分離)、資料安全(本地部署)。「說話者分離(Speaker Diarization)」是語音辨識在多人場景的關鍵技術,務必記住術語。
Q1. 自適應學習系統使用強化學習(RL)為學生規劃學習路徑時,下列何者最適合作為 RL 的「獎勵(Reward)」?
- A. 學生每次完成一道題目就給予固定獎勵 +1
- B. 以學生的長期學習成效(如期末測驗進步幅度)與學習持續意願作為綜合獎勵訊號
- C. 系統給出題目後,若學生 30 秒內回答則給予最高獎勵
- D. 以學生答對的題目數量除以總題數,作為唯一獎勵
Q2. 某 AI 寫作偵測工具使用「困惑度(Perplexity)」分析學生作業。請問困惑度與 AI 生成可能性的關係為何?
- A. 困惑度越高,越可能是 AI 生成——因為 AI 喜歡用罕見詞彙
- B. 困惑度越低,越可能是 AI 生成——因為 AI 傾向選擇「最可能的下一個詞」,文字極為流暢
- C. 困惑度與 AI 生成無關,偵測 AI 作業只能靠比對資料庫
- D. AI 生成的文字困惑度與人類寫作完全相同,無法用此方法區分
Q3. 台灣財政部智慧客服在民眾詢問「我的退稅什麼時候入帳?」時,系統辨識意圖後查詢知識庫,得到的答案信心分數只有 45%(門檻設為 70%)。下列何者是最恰當的系統行為?
- A. 直接輸出信心最高的答案,不告知民眾信心不足
- B. 系統關閉對話,請民眾改打電話
- C. 自動轉接至真人客服(人工升級機制 Human Escalation),同時保留對話記錄
- D. 要求民眾重新輸入問題三次,等待信心分數上升
Q4. 台灣數位部公部門 AI 應用參考手冊的六大治理維度中,「AI 系統在做出影響民眾權益的決策時,必須能提供可理解的決策理由,並建立申訴覆核機制」,這描述的是哪兩個維度的結合?
- A. 合法性 + 安全性
- B. 透明性(Transparency)+ 問責性(Accountability)
- C. 公平性 + 人本性
- D. 安全性 + 公平性
Q5. 在偏遠地區推廣 AI 輔助教學時,最可能面臨哪一項挑戰?下列哪一個對策最能直接解決此挑戰?
- A. 挑戰:教材太難 → 對策:降低課程難度
- B. 挑戰:數位落差(Digital Divide)——學生缺乏裝置與穩定網路存取 AI 工具 → 對策:政府補助設備與寬頻網路,同時提供離線可用的 AI 教學功能
- C. 挑戰:AI 演算法不夠準確 → 對策:採購更昂貴的 GPU 伺服器
- D. 挑戰:教師人數不足 → 對策:以 AI 完全取代所有教師
解答與解析
| 題號 | 答案 | 解析 |
|---|---|---|
| Q1 | B | RL 的獎勵設計決定了系統優化的方向。選 A(每題固定 +1)只會讓系統讓學生一直做題,不管有沒有學到東西。選 C(30 秒內回答)獎勵速度而非理解。選 D(答對率)仍是短期指標,可能讓系統一直出簡單題。只有選 B 以長期學習成效與學習持續意願為獎勵,才能真正驅動系統設計出讓學生長期進步的路徑。 |
| Q2 | B | 語言模型在生成文字時,傾向選擇「給定前文後最可能出現的下一個詞」,因此 AI 生成的文字在語言模型的預測機率分布下,不確定性(困惑度)偏低——文字極為流暢、可預測。困惑度越低,意味著文字越「符合語言模型預期」,越可能是 AI 生成。有個人風格、創意表達的人類寫作反而困惑度較高,因為人類更常使用意想不到的表達方式。 |
| Q3 | C | 信心分數 45% 低於門檻 70%,代表系統對此問題的知識庫答案把握不足,直接回覆風險高(可能給出錯誤的稅務資訊,後果嚴重)。正確做法是啟動人工升級機制(Human Escalation),將對話轉接至真人客服,同時保留完整的對話記錄,讓真人客服能了解民眾問題的來龍去脈,不需要民眾重新解釋。選 A 可能誤導民眾;B 關閉對話服務體驗極差;D 重複輸入不會改變信心分數。 |
| Q4 | B | 「能提供可理解的決策理由」對應透明性(Transparency)——讓民眾知道 AI 為何如此決定;「建立申訴覆核機制」對應問責性(Accountability)——確保 AI 決策錯誤時有明確的救濟管道與責任歸屬。這兩個維度在政府 AI 中特別重要,因為政府決策直接影響公民的法律權益,無法像企業一樣以「商業秘密」為由拒絕說明。 |
| Q5 | B | 偏遠地區推廣 AI 教學最根本的障礙是數位落差——學生缺乏裝置(手機/電腦)與穩定寬頻網路,連基本的 AI 工具存取都無法做到,再好的 AI 演算法也無從發揮。最直接的對策是政府補助硬體設備與網路基礎建設,同時開發「離線模式(Offline Mode)」的 AI 教學功能,降低對網路的依賴。選 D 「完全取代教師」違背人本性原則,且會消滅教育中不可替代的人際關係與情感支持。 |