一、學習目標
完成本單元後,你將能夠:
- 說明金融業為何是 AI 應用最成熟的產業之一
- 描述信用評分模型的運作邏輯與公平性挑戰
- 理解詐欺偵測的技術原理與類別不平衡問題
- 解釋演算法交易與量化策略的 AI 技術基礎
- 說明 NLP 如何應用於智慧客服與投資顧問
- 掌握 AI 在市場風險管理與法規遵循中的角色
- 了解台灣金管會 AI 指引的核心要求
二、核心內容
2-1 為什麼金融業是 AI 的最佳訓練場?
生活比喻:金融業就像 AI 的奧林匹克運動場——規則明確、有大量數據、成敗一目了然。
金融業之所以成為 AI 落地最深、最廣的產業,有三個結構性原因:
1. 資料量龐大且高度結構化 每天數以億計的交易紀錄、信用查詢、客戶行為日誌,全部以數字形式存在,幾乎不需要複雜的資料前處理就能直接餵給機器學習模型。
2. 成效指標清楚可量化 預測準不準?詐欺抓出來多少?獲利損失幾元?金融業的 KPI 非常明確,AI 模型的好壞可以被直接量測與比較。
3. 決策的速度要求遠超人類 高頻交易以毫秒計算、詐欺偵測需要在交易完成前完成判斷,這些場景下人工審核根本跟不上,AI 是唯一解。
2-2 應用一:信用評分(Credit Scoring)
生活比喻:銀行借你錢之前,要先評估你還錢的可能性——就像你借東西給朋友前,會先想想他過去的信用紀錄。
傳統做法 vs. AI 做法
| 面向 | 傳統信用評分 | AI 信用評分 |
|---|---|---|
| 方法 | 統計公式(FICO 分數) | Logistic Regression、XGBoost、隨機森林 |
| 特徵來源 | 收入、負債、還款紀錄 | 以上 + 消費行為、社交資料、手機使用紀錄 |
| 更新頻率 | 定期更新 | 可即時更新 |
| 可解釋性 | 高 | XGBoost 中等,深度學習低 |
常用特徵(Features)
- 收入水準與穩定性(Income stability)
- 負債比率(Debt-to-income ratio)
- 過去還款紀錄(Payment history)
- 信用使用率(Credit utilization)
- 信用申請次數(Hard inquiries)
核心挑戰:公平性與可解釋性
AI 信用評分面臨的最大爭議是演算法歧視(Algorithmic Bias)。若訓練資料本身帶有歷史偏見(例如某族群過去因非信用因素而貸款被拒),模型可能學到並放大這些偏見。
台灣金管會 AI 指引要求:金融機構使用 AI 進行信用決策時,必須能對客戶說明決策理由,不得以「黑箱」為由拒絕解釋。這正是為什麼可解釋 AI(Explainable AI, XAI)在金融業格外重要。
| 方法 | 可解釋性 | 準確度 | 金融業適用性 |
|---|---|---|---|
| Logistic Regression | 高 | 中 | 法規遵循首選 |
| XGBoost | 中(可用 SHAP 解釋) | 高 | 主流選擇 |
| 深度神經網路 | 低 | 高 | 需搭配 XAI 工具 |
2-3 應用二:詐欺偵測(Fraud Detection)
生活比喻:信用卡公司就像便利商店的店員,在你結帳時悄悄觀察——如果你突然在凌晨三點於海外刷了一筆不尋常的消費,店員(AI)會立刻發出警報。
技術架構
詐欺偵測是典型的**異常偵測(Anomaly Detection)**問題:大多數交易是正常的,詐欺行為是少數異常點。
- 規則型系統(Rule-based):設定固定規則(如「單筆超過 10 萬元自動審核」),速度快但容易被繞過
- 機器學習模型:Isolation Forest、One-class SVM,學習「正常行為」的邊界
- 序列模型(LSTM):分析交易序列的時間模式,例如「5 分鐘內在三個不同城市刷卡」這種時序異常
- 即時評分(Real-time Scoring):每筆交易在幾毫秒內完成風險評分,超過閾值才觸發人工審核
核心挑戰:類別不平衡(Class Imbalance)
詐欺交易可能只佔所有交易的 0.1%,若模型把所有交易都預測為「正常」,Accuracy 高達 99.9%,但毫無用處。
解決方法:
| 技術 | 說明 |
|---|---|
| SMOTE(合成少數類過採樣) | 人工生成詐欺案例,補充訓練資料 |
| 調整類別權重(Class Weight) | 讓模型在詐欺案例上給予更高懲罰 |
| 使用 Recall 而非 Accuracy | 評估指標改為「所有詐欺中被抓到的比例」 |
| Threshold 調整 | 降低判定詐欺的機率門檻,寧可誤判也不漏判 |
2-4 應用三:演算法交易與量化策略(Algorithmic / Quantitative Trading)
生活比喻:傳統交易員像廚師憑感覺調味;量化交易員像食品工廠,用精確配方大量複製,AI 則讓這個工廠能自動學習新食譜。
三大技術方向
① 時間序列預測(Time Series Forecasting) 使用 LSTM、Transformer 等模型預測股價走勢,輸入為歷史價格、交易量、技術指標(MACD、RSI)。
② 強化學習(Reinforcement Learning, RL) AI 代理在模擬市場環境中學習買賣策略,透過反覆試錯找到最大化報酬的行動策略。
③ 情緒分析(Sentiment Analysis) 對新聞標題、財報電話會議逐字稿、社群媒體貼文進行 NLP 分析,提取市場情緒信號:
新聞:「Fed 暗示升息步伐放緩」
↓ NLP 情緒分析
情緒分數:+0.72(正面)
↓ 交易訊號
動作:買入股票 ETF
重要警示
| 風險 | 說明 |
|---|---|
| 過度擬合(Overfitting) | 模型在歷史資料表現完美,實盤卻慘敗 |
| 市場衝擊(Market Impact) | 演算法大量下單影響市場本身 |
| 閃崩風險(Flash Crash) | 多個 AI 系統同時做出相同決策,導致市場瞬間崩潰 |
2-5 應用四:智慧客服與 AI 理財顧問(Smart Customer Service)
生活比喻:過去你得排隊等銀行行員解答問題;現在 AI 客服 24 小時在線,還能根據你的帳戶資料給出個人化建議。
技術堆疊
- 意圖分類(Intent Classification):判斷客戶訊息屬於「查詢餘額」、「掛失卡片」還是「申請貸款」
- 實體抽取(Named Entity Recognition, NER):從對話中識別帳號、金額、日期等關鍵資訊
- GPT 型對話模型:生成流暢、符合語境的回應,處理複雜或開放式問題
- 人工轉接機制(Human Handoff):偵測到高情緒負荷或高風險問題時,自動轉接真人客服
AI 理財顧問(Robo-Advisor)
根據客戶的風險承受度、投資目標、年齡等資料,自動生成資產配置建議(如股債比例),並持續再平衡(Rebalancing)。台灣的國泰、玉山、永豐等銀行均已推出相關服務。
2-6 應用五:風險管理與法規遵循(Risk Management & RegTech)
生活比喻:AI 就像銀行的 24 小時健康監測儀——持續追蹤所有「生命跡象」,一旦偵測到異常就立即發出警報。
市場風險建模(Market Risk Modeling)
- VaR(Value at Risk)模型增強:傳統統計假設常態分布,AI 可學習更複雜的尾部風險
- 壓力測試(Stress Testing):模擬極端情境(如金融海嘯、COVID 衝擊)對資產組合的影響
- 情境分析(Scenario Analysis):生成多個假設情境,評估不同總體經濟條件下的曝險
法規遵循自動化(RegTech)
| 任務 | AI 技術 |
|---|---|
| 反洗錢(AML)監控 | 圖神經網路(GNN)追蹤資金流向 |
| KYC 身份驗證 | 電腦視覺(CV)+ NLP 核驗文件 |
| 法規報告自動生成 | NLP 萃取數據、自動填報 |
| 異常交易申報 | 異常偵測模型即時標記 |
2-7 台灣金管會 AI 指引重點
台灣金融監督管理委員會於 2023 年發布「金融業運用人工智慧(AI)指引」,核心要求包括:
| 原則 | 具體要求 |
|---|---|
| 可解釋性 | 對客戶的 AI 決策(如信用拒絕)須能說明主要理由 |
| 公平性 | 禁止以不當特徵(如種族、性別)作為信用決策依據 |
| 人工監督 | 高風險決策須有人工審核機制,不得全自動化 |
| 資料治理 | 訓練資料須合法取得,確保資料品質與代表性 |
| 持續監控 | 模型上線後須定期評估效能與公平性,防止模型漂移 |
2-8 倫理考量:演算法歧視與問責制
借貸決策中的歧視風險
若訓練資料反映了歷史上對特定族群的不公平對待,AI 模型可能將歧視自動化並規模化。例如,郵遞區號(代理變數)可能間接反映種族或社經背景,導致模型對特定社區居民系統性拒貸。
演算法問責(Algorithmic Accountability)
- 誰為 AI 的錯誤決策負責?是開發者、金融機構,還是模型本身?
- 台灣《金融消費者保護法》要求金融機構對消費者負有說明義務
- 歐盟 AI 法案(EU AI Act)將信用評分列為「高風險 AI 系統」,要求嚴格監管
三、關鍵名詞中英對照
| 中文 | 英文 |
|---|---|
| 信用評分 | Credit Scoring |
| 詐欺偵測 | Fraud Detection |
| 演算法交易 | Algorithmic Trading |
| 量化交易 | Quantitative Trading |
| 異常偵測 | Anomaly Detection |
| 類別不平衡 | Class Imbalance |
| 情緒分析 | Sentiment Analysis |
| 智慧客服 | Smart Customer Service |
| 機器人理財顧問 | Robo-Advisor |
| 意圖分類 | Intent Classification |
| 實體抽取 | Named Entity Recognition (NER) |
| 市場風險 | Market Risk |
| 壓力測試 | Stress Testing |
| 風險值 | Value at Risk (VaR) |
| 反洗錢 | Anti-Money Laundering (AML) |
| 法規科技 | RegTech (Regulatory Technology) |
| 可解釋 AI | Explainable AI (XAI) |
| 演算法歧視 | Algorithmic Bias |
| 演算法問責 | Algorithmic Accountability |
| 再平衡 | Rebalancing |
| 閃崩 | Flash Crash |
| 強化學習 | Reinforcement Learning (RL) |
四、考試重點提示
重點 1:金融 AI 五大應用場景 信用評分、詐欺偵測、演算法交易、智慧客服、風險管理。每個場景都有其核心技術與主要挑戰,考試常以情境題方式考「哪個技術對應哪個應用」。
重點 2:詐欺偵測的類別不平衡問題 詐欺案例極少(0.1% 以下),Accuracy 不是正確的評估指標,應改用 Recall 或 F1-Score。解決方法包括 SMOTE、調整類別權重、降低判定閾值。
重點 3:信用評分的可解釋性要求 台灣金管會明確要求金融機構的 AI 信用決策須能說明理由,因此可解釋 AI(XAI)與 SHAP 值在金融業格外重要。Logistic Regression 天生可解釋;XGBoost 需搭配 SHAP;深度學習可解釋性最低。
重點 4:量化交易的三大 AI 技術 時間序列預測(LSTM/Transformer)、強化學習(RL)、情緒分析(NLP)。考試常考這三者的技術名稱與對應的市場應用。
重點 5:台灣金管會 AI 指引核心原則 可解釋性、公平性、人工監督、資料治理、持續監控。特別注意「高風險決策須有人工審核」這一點,代表 AI 在金融業不能完全取代人類決策。
1. 某銀行使用 AI 模型自動審核貸款申請,模型將某社區的居民全部拒絕,但該社區居民的還款能力其實沒有問題。這個現象最可能是什麼原因造成的?
2. 信用卡詐欺偵測系統中,詐欺交易僅佔所有交易的 0.05%。若模型對所有交易都預測「正常」,其 Accuracy 為 99.95%,請問這個模型有用嗎?應該改用哪個評估指標?
3. 以下哪項技術最適合分析「客戶在 10 分鐘內連續在三個不同城市刷卡」這種時序型詐欺行為?
- (A) Logistic Regression
- (B) LSTM(長短期記憶網路)
- (C) K-Means 分群
- (D) 線性迴歸
4. 台灣金管會 AI 指引針對金融業 AI 應用提出哪五大核心原則?請列出並各以一句話說明。
5. 量化交易 AI 中的「情緒分析」是指什麼?請說明其輸入資料來源與輸出結果各是什麼。
解答與解析
| 題號 | 答案 |
|---|---|
| 1 | 訓練資料中存在歷史偏見(演算法歧視),郵遞區號等代理變數間接代入了社經或族群因素 |
| 2 | 沒有用;應改用 Recall(召回率)或 F1-Score |
| 3 | (B) |
| 4 | 可解釋性、公平性、人工監督、資料治理、持續監控 |
| 5 | 對新聞/社群文字進行 NLP 分析;輸入為文字資料,輸出為情緒分數(正/負/中性)作為交易訊號 |
詳細解析:
第 1 題: 這是**演算法歧視(Algorithmic Bias)**的典型案例。模型可能學到「住在某郵遞區號的人還款率低」這個模式,但這個模式可能源自歷史上的不公平貸款政策,而非該社區居民真實的信用能力。台灣金管會 AI 指引正是為了防範此類問題,要求信用決策必須排除不當特徵並能說明理由。
第 2 題: 完全沒有用。Accuracy 在類別嚴重不平衡時是具誤導性的指標。此模型的 Recall = 0,代表它完全沒有識別出任何一筆詐欺交易。正確做法是改用 Recall(確保詐欺被抓出來)或 F1-Score(兼顧精確率與召回率),並搭配 SMOTE 等技術解決資料不平衡問題。
第 3 題:(B) LSTM(Long Short-Term Memory)是專為處理**序列資料(Sequential Data)**設計的遞歸神經網路,能夠記住過去一段時間的交易模式,因此最適合偵測「短時間內跨地域刷卡」這類時序異常行為。Logistic Regression 無法處理序列關係,K-Means 是分群而非分類,線性迴歸用於連續值預測。
第 4 題: 台灣金管會 AI 指引五大核心原則:
- 可解釋性:AI 決策須能對客戶說明主要理由
- 公平性:禁止使用不當特徵進行歧視性決策
- 人工監督:高風險決策須保留人工審核機制
- 資料治理:訓練資料須合法取得且具代表性
- 持續監控:模型上線後須定期評估效能與公平性
第 5 題: 量化交易中的**情緒分析(Sentiment Analysis)**是指使用 NLP 技術分析文字資料以提取市場情緒信號。輸入資料包括:財經新聞標題、財報電話會議逐字稿、Twitter/Reddit 社群媒體貼文、分析師報告等。輸出結果為情緒分數(如 +0.8 表示正面、-0.6 表示負面),作為交易策略的輸入信號——例如「當主要財經媒體對某股票的情緒分數超過閾值時,自動執行買入」。