ANGELA JIAN
LOADING
回到課程總覽
第 51 篇 L11+L12 總複習與模擬考

考前衝刺:iPAS AI 應用規劃師全範圍速查表

Angela Jian
Angela Jian 簡琬庭
iPAS AI 應用規劃師 / AI Product Builder

本篇為純參考速查,無模擬考題。建議列印或開啟在副螢幕,配合複習使用。


AI 基礎概念速查

關鍵年份與人物

年份事件重要性
1950Alan Turing 發表《Computing Machinery and Intelligence》,提出圖靈測試AI 思想起點
1956Dartmouth Conference,John McCarthy 首次提出「Artificial Intelligence」一詞AI 學科正式誕生
1986Rumelhart、Hinton 等人推廣反向傳播演算法(Backpropagation)神經網路訓練基礎
1997IBM Deep Blue 擊敗西洋棋世界冠軍 KasparovNarrow AI 里程碑
2006Geoffrey Hinton 提出深度信念網路(DBN),掀起深度學習復興Deep Learning 元年
2012AlexNet 以深度 CNN 贏得 ImageNet 競賽,錯誤率大幅下降深度學習主流化
2017Google Brain 發表《Attention Is All You Need》,提出 Transformer 架構現代 LLM 基礎
2018Google 發布 BERT,OpenAI 發布 GPT-1預訓練語言模型時代
2020OpenAI 發布 GPT-3(1750 億參數)大型語言模型崛起
2022OpenAI 發布 ChatGPT,生成式 AI 進入大眾視野GenAI 普及化分水嶺
2024歐盟 AI Act 正式生效全球首部全面性 AI 法規

AI 分類體系

按智能程度

類型英文特徵現況
弱 AIWeak AI / Narrow AI只能執行特定任務現今所有商業 AI
強 AIStrong AI / AGI具備跨領域通用智慧,如人類尚未實現
超 AISuper AI / ASI全面超越人類智慧假設性概念

按記憶能力(Arend Hintze 分類)

類型英文代表系統
純反應型Reactive MachinesDeep Blue(西洋棋 AI)
有限記憶型Limited Memory自動駕駛、推薦系統、現代 LLM
心智理論型Theory of Mind理論中,未實現
自我意識型Self-Aware AI假設性,科幻概念

Russell & Norvig 四象限

像人類(Human-like)理性(Rational)
思考(Thinking)像人類一樣思考(認知模型方法)理性思考(邏輯推論方法)
行動(Acting)像人類一樣行動(圖靈測試方法)理性行動(理性代理人方法)← 主流研究方向

AI 治理與法規速查

負責任 AI(Responsible AI)六大原則

原則英文一句話說明
公平性FairnessAI 決策不應對特定族群產生歧視或偏見
可靠性與安全性Reliability & SafetyAI 系統須穩定運作且不造成危害
隱私性Privacy & Security保護個人資料,防止未授權存取
普惠性InclusivenessAI 應服務所有人,不排除弱勢族群
透明性TransparencyAI 決策過程應可理解與解釋
問責性Accountability明確界定 AI 決策的責任歸屬

歐盟 AI Act 四級風險

風險等級英文監管方式典型應用
不可接受風險Unacceptable Risk直接禁止公共場所即時生物辨識、社會信用評分、操控弱勢族群的 AI
高風險High Risk嚴格合規義務(6項)+ CE 標誌信用評分、招募篩選、醫療診斷、入學篩選、移民審核
有限風險Limited Risk透明度告知義務聊天機器人(須告知是 AI)、深度偽造(Deep Fake)標示
低風險 / 無風險Minimal/No Risk幾乎無額外義務AI 垃圾郵件過濾、AI 推薦播放清單

高風險 AI 六大合規義務:資料治理、技術文件、透明度、人為監督、準確性與穩健性、符合性評估(CE 標誌)


NIST AI Risk Management Framework(AI RMF)

功能英文核心任務
治理Govern建立 AI 風險管理的文化、政策與職責
對應Map識別並分類 AI 系統的風險情境
量測Measure分析、評估與追蹤 AI 風險
管理Manage優先處理並回應已識別的 AI 風險

記憶口訣:G-M-M-M(Govern → Map → Measure → Manage)


台灣 AI 相關法規快速查詢

主管機關相關法規 / 指引重點
數位部(MODA)AI 基本法草案、資料治理框架台灣 AI 整體治理架構
金管會(FSC)金融業 AI 使用指引金融業 AI 模型風險管理、公平對待客戶
經濟部產業 AI 化推動計畫製造業、中小企業 AI 導入補助
衛福部AI 醫療器材審查指引醫療 AI 軟體的查驗登記要求

GDPR 七大資料主體權利

權利英文一句話說明
知情權Right to be Informed有權知道企業如何使用你的資料
查閱權Right of Access有權要求查看企業持有你的哪些資料
更正權Right to Rectification有權要求更正不正確的個人資料
被遺忘權Right to Erasure有權在特定條件下要求刪除個人資料
限制處理權Right to Restrict Processing有權要求限制(而非刪除)資料的使用方式
可攜權Right to Data Portability有權以結構化格式取得資料並轉移至其他業者
反對權Right to Object有權反對特定目的(如行銷)的資料處理

資料處理速查

資料類型三大類

類型英文特徵例子
結構化資料Structured Data固定欄位、可存入關聯式資料庫Excel 表、SQL 資料庫、感測器數值
半結構化資料Semi-Structured Data有部分結構但不固定JSON、XML、電子郵件、HTML
非結構化資料Unstructured Data無固定格式,佔資料總量約 80%圖片、影片、語音、自由文字

資料管線 8 階段

階段英文說明
1. 資料收集Data Collection從各來源蒐集原始資料
2. 資料儲存Data Storage選擇適合的儲存架構(資料湖、資料倉儲)
3. 資料清理Data Cleaning處理缺失值、異常值、重複資料
4. 資料整合Data Integration合併多來源資料,統一格式
5. 資料轉換Data Transformation正規化、標準化、編碼
6. 特徵工程Feature Engineering萃取、建立對模型有用的特徵
7. 資料分割Data Splitting訓練集 / 驗證集 / 測試集(常見比例 70/15/15 或 80/10/10)
8. 資料版本管理Data Versioning追蹤資料集版本,確保實驗可重現

五種資料偏誤(Bias)

偏誤類型英文成因例子
歷史 / 社會偏誤Historical/Societal Bias訓練資料反映歷史不平等舊招募資料中男性佔多數,導致 AI 歧視女性求職者
抽樣偏誤Sampling Bias樣本不具代表性只用都市醫院資料訓練,農村病患診斷準確率低
測量偏誤Measurement Bias資料收集方式不一致不同醫院使用不同標準測量血壓
確認偏誤Confirmation Bias選擇性收集支持既有假設的資料只選用支持特定結論的資料集
標籤偏誤Labeling Bias人工標籤者的主觀判斷影響標籤標籤員對「攻擊性語言」的認定因文化背景而異

資料品質五大維度

維度英文說明
完整性Completeness無缺失值、無遺漏欄位
準確性Accuracy資料符合真實情況
一致性Consistency跨系統、跨時間的資料定義相同
及時性Timeliness資料為最新且可用
唯一性Uniqueness無重複紀錄

機器學習速查

四大學習類型

學習類型英文訓練資料目標代表模型
監督式學習Supervised Learning有標籤的 (X, Y) 配對預測標籤 Y線性回歸、SVM、CNN、隨機森林
非監督式學習Unsupervised Learning只有輸入 X,無標籤發現隱藏結構K-means、DBSCAN、PCA、自編碼器
半監督式學習Semi-Supervised Learning少量有標籤 + 大量無標籤充分利用未標籤資料Self-training、Label Propagation
強化學習Reinforcement Learning環境互動的獎懲信號最大化長期獎勵DQN、PPO、AlphaGo

主要模型比較

模型類別核心原理適用場景優點缺點
線性回歸監督(回歸)最小化均方誤差的線性擬合數值預測可解釋性高、訓練快只能捕捉線性關係
邏輯回歸監督(分類)Sigmoid 函數輸出機率二元分類可解釋、輸出機率無法處理非線性
SVM監督(分類)最大化類別間隔(Margin)高維小樣本分類高維有效、核技巧大資料集訓練慢
決策樹監督資訊增益 / Gini 係數遞迴分割可解釋性需求高易理解、可視化易過擬合
隨機森林監督(集成)Bagging + 多棵決策樹投票通用分類回歸準確率高、防過擬合可解釋性低
KNN監督K 個最近鄰的多數投票小資料集分類簡單直觀預測時計算量大
XGBoost監督(集成)Gradient Boosting 串接弱學習器結構化資料競賽準確率極高超參數調整複雜
CNN監督(深度學習)卷積核萃取空間特徵影像、影片自動學習空間特徵需大量資料
RNN監督(深度學習)隱藏狀態傳遞序列記憶時序資料(基礎)處理序列梯度消失、無法平行
LSTM監督(深度學習)遺忘門、輸入門、輸出門控制記憶長序列、時間序列解決梯度消失結構複雜
Transformer監督(深度學習)自注意力機制,可平行計算NLP、多模態長距離依賴、可平行計算資源需求高

評估指標公式

指標英文公式說明
準確率Accuracy(TP + TN) / (TP + TN + FP + FN)整體預測正確比例
精確率PrecisionTP / (TP + FP)預測為正例中真正是正例的比例(避免假警報)
召回率Recall / SensitivityTP / (TP + FN)實際正例中被正確預測的比例(避免漏報)
F1 分數F1 Score2 × (Precision × Recall) / (Precision + Recall)Precision 與 Recall 的調和平均
AUC-ROCAUCROC 曲線下面積,越接近 1 越好不受類別不平衡影響的整體分類能力

考試提示:高 Precision 低 Recall → 模型保守,漏報多(如罕見病篩檢不好);高 Recall 低 Precision → 模型積極,誤報多(如垃圾郵件過濾誤傷正常信)


過擬合(Overfitting)解決方案

方法英文說明
增加訓練資料More Training Data最根本的解法
資料擴增Data Augmentation翻轉、旋轉、裁切等方式擴充訓練集
正規化 L1/L2L1/L2 Regularization懲罰大的權重值(L1=Lasso,L2=Ridge)
DropoutDropout訓練時隨機關閉部分神經元
早停Early Stopping驗證集損失不再下降時停止訓練
減少模型複雜度Reduce Model Complexity降低層數、參數數量
交叉驗證Cross-ValidationK-fold CV 評估模型泛化能力

鑑別式 vs 生成式 AI 速查

核心對比

比較維度鑑別式 AI(Discriminative AI)生成式 AI(Generative AI)
建模目標條件機率 P(Y|X)聯合分佈 P(X,Y) 或邊際分佈 P(X)
核心任務分類、預測生成新資料
典型模型SVM、邏輯回歸、CNN(分類)、BERTGAN、VAE、Diffusion、GPT
應用影像分類、情感分析、詐欺偵測影像生成、文字創作、程式碼生成
輸出類別標籤或數值新的資料樣本(圖片、文字、音訊)

主要生成式 AI 架構一覽

架構英文核心機制代表應用
生成對抗網路GAN生成器與鑑別器對抗訓練高擬真人臉生成(StyleGAN)、深度偽造
變分自編碼器VAE潛空間學習連續機率分佈,取樣生成影像生成、資料擴增、藥物設計
擴散模型Diffusion Model前向加噪 + 逆向去噪學習Stable Diffusion、DALL-E 2、Midjourney
大型語言模型LLMTransformer 自迴歸預測下一個 TokenGPT-4、Claude、Gemini、Llama

整合技術摘要

技術英文說明
遷移學習Transfer Learning將預訓練模型的知識遷移至新任務,減少訓練需求
微調Fine-tuning在預訓練模型基礎上,用少量目標資料繼續訓練
特徵萃取Feature Extraction凍結預訓練模型權重,只訓練新增的分類頭
提示工程Prompt Engineering透過設計輸入提示引導模型輸出,無需更新權重
RAGRetrieval-Augmented Generation結合外部知識庫查詢,強化生成準確性

生成式 AI 應用速查

主要工具類型

類別代表工具主要用途
文字生成ChatGPT、Claude、Gemini、Llama對話、寫作、摘要、翻譯、程式碼
影像生成Midjourney、Stable Diffusion、DALL-E藝術創作、廣告素材、設計原型
程式碼生成GitHub Copilot、Cursor、CodeWhisperer程式碼補全、Bug 修復、文件生成
語音合成ElevenLabs、Azure TTS、Google TTS有聲書、語音助理、客服 IVR
影片生成Runway Gen-3、Sora、Pika廣告影片、教育內容、創意短片
多模態GPT-4V、Gemini Ultra、Claude 3圖文理解、文件分析、視覺問答

No-Code vs Low-Code AI

比較維度No-Code AILow-Code AI
程式碼需求完全零程式碼少量程式碼(關鍵環節可客製化)
目標用戶業務人員、非技術人員有基礎程式能力的開發者或進階用戶
彈性較低,功能受工具限制較高,可客製化核心邏輯
代表工具Teachable Machine、Google AutoML、LobeAzure ML Designer、H2O.ai、Hugging Face AutoTrain
典型用途快速 POC、部門級小型應用企業級應用、需客製化的生產環境
開發速度最快快(相較全程式碼開發)

Prompt Engineering 五大技術

技術英文說明範例
零樣本提示Zero-shot Prompting直接描述任務,不給範例「翻譯以下句子為英文:…」
少樣本提示Few-shot Prompting在提示中提供 2-5 個輸入輸出範例「以下是情感分析範例:[例1][例2],現在分析:…」
思維鏈提示Chain-of-Thought (CoT)引導模型展示推理步驟「讓我們一步一步思考…」
角色提示Role Prompting指定模型扮演特定角色「你是一位資深醫師,請解釋…」
結構化輸出Structured Output要求特定格式輸出(JSON、表格等)「請以 JSON 格式回傳:{“name”: …, “score”: …}」

RAG 管線步驟

步驟說明
1. 文件載入(Document Loading)讀取 PDF、Word、網頁等來源文件
2. 文件切塊(Chunking)將文件切割成適當大小的文字片段
3. 向量化(Embedding)使用 Embedding 模型將文字轉為向量
4. 向量儲存(Vector Store)存入向量資料庫(如 Pinecone、Chroma、FAISS)
5. 查詢轉換(Query Encoding)將用戶問題轉為查詢向量
6. 相似度檢索(Similarity Search)從向量庫找出最相關的文字片段
7. 增強生成(Augmented Generation)將檢索結果注入 Prompt,送給 LLM 生成回答

LLM 訓練四階段

階段英文訓練資料目標
1. 預訓練Pre-training大規模無標籤文本(網路爬蟲、書籍等)學習語言的統計規律與世界知識
2. 監督式微調Supervised Fine-tuning (SFT)高品質問答對(人工標注)學習指令遵循格式
3. 獎勵模型訓練Reward Model Training人類對多個回答的排序偏好訓練可預測人類偏好的評分模型
4. 強化學習對齊RLHF(PPO 等算法)獎勵模型的評分信號使模型輸出符合人類價值觀與偏好

導入規劃速查

AI 導入評估四大面向

評估面向核心問題
技術可行性(Technical Feasibility)資料是否足夠?算力是否充足?技術成熟度?
商業可行性(Business Feasibility)ROI 是否正向?與業務目標是否契合?
倫理合規性(Ethics & Compliance)是否符合法規?是否涉及隱私或偏見風險?
組織準備度(Organizational Readiness)團隊能力、變革管理、資料文化是否就緒?

AI 導入部署規劃階段

階段主要活動
1. 問題定義確定 AI 應解決的具體業務問題,定義成功指標(KPI)
2. 資料盤點評估現有資料的量、質、可用性
3. 概念驗證(POC)小規模試驗,驗證技術方向可行性
4. 試驗部署(Pilot)選定部門或場景進行受控環境測試
5. 全面部署(Rollout)系統整合、使用者訓練、正式上線
6. 監控與迭代(Monitor & Iterate)持續監控模型效能、資料漂移(Data Drift)、偏誤

生成式 AI 六大風險

風險英文說明緩解方式
幻覺Hallucination模型生成不正確或捏造的資訊RAG、事實查核、人工審核
著作權侵犯Copyright Infringement生成內容可能侵犯訓練資料的著作權使用授權資料、法務審查
隱私洩漏Privacy Leakage模型可能記憶並洩漏訓練資料中的個資差分隱私、資料去識別化
偏見放大Bias Amplification模型放大訓練資料中的歧視性偏見偏見審計、多元訓練資料
惡意使用Misuse / Jailbreak生成有害內容、詐騙文字、武器資訊護欄(Guardrails)、內容過濾
過度依賴Over-reliance用戶對 AI 輸出未加批判性思考即接受使用者教育、顯示信心分數

成本效益分析框架

類別項目
成本面系統建置費、授權費、雲端算力、資料標注、人員訓練、維護費用
效益面人工成本節省、生產效率提升、錯誤率降低、客戶滿意度提升、新商業模式創造
計算指標ROI = (總效益 − 總成本) / 總成本 × 100%;投資回收期(Payback Period)
難量化效益品牌形象提升、員工工作滿意度、決策品質改善

易混淆比較總表

比較對象左側右側關鍵差異
AI vs ML vs DLAI(最廣)⊃ ML(統計學習)⊃ DL(深度神經網路)DL 是 ML 的子集,ML 是 AI 的子集
監督式 vs 非監督式 vs 強化學習監督:有標籤 (X,Y)非監督:只有 X;強化:獎懲信號資料類型與學習目標不同
CNN vs RNN vs TransformerCNN:空間特徵,影像擅長RNN:序列,有梯度消失問題;Transformer:自注意力,可平行適用資料型態與架構設計不同
BERT vs GPTBERT:雙向編碼器,理解任務(填空、分類)GPT:單向解碼器,生成任務(自迴歸生成)一個擅長理解,一個擅長生成
Precision vs RecallPrecision = TP/(TP+FP),衡量預測為正的準確性Recall = TP/(TP+FN),衡量實際為正的覆蓋率偽陽性 vs 偽陰性的取捨
Overfitting vs UnderfittingOverfitting:訓練準確率高,測試準確率低(模型太複雜)Underfitting:訓練和測試準確率都低(模型太簡單)偏差-方差取捨(Bias-Variance Tradeoff)
No-Code vs Low-CodeNo-Code:零程式碼,視覺化操作Low-Code:少量程式碼,提供更高彈性目標用戶技術能力不同
GDPR vs 台灣個資法GDPR:EU 法規,域外效力,罰款高達 2000 萬歐元或全球營收 4%台灣個資法:適用台灣境內,罰則相對較輕適用範圍、罰則強度不同
差分隱私 vs 聯邦學習差分隱私:在資料/輸出中加入隨機噪音聯邦學習:資料不離開本地,只上傳模型參數兩者可同時使用,保護層次不同
GAN vs VAE vs DiffusionGAN:對抗訓練,生成品質高但訓練不穩定VAE:機率潛空間,訓練穩定但輸出稍模糊;Diffusion:逐步去噪,品質最高但速度最慢訓練穩定性與生成品質的取捨

祝考試順利!記得:理解原理 > 死背術語。遇到不確定的題目,先排除明顯錯誤選項,再從概念邏輯推導答案。