一、學習目標
完成本單元後,你將能夠:
- 說明 RFM 模型與 K-Means 分群如何實現客戶分群(Customer Segmentation)
- 區分協同過濾(Collaborative Filtering)與內容過濾(Content-Based Filtering)的原理與優缺點
- 解釋動態定價(Dynamic Pricing)背後的需求預測與最佳化邏輯
- 描述 AI 廣告投放中相似受眾(Lookalike Audience)、CTR 預測與 A/B 測試自動化的運作方式
- 說明對話式商務(Conversational Commerce)與冷啟動問題(Cold Start Problem)的解決策略
- 理解顧客終身價值(Customer Lifetime Value, CLV)預測的商業意義
- 掌握隱私保護的零方/第一方資料策略,因應 Cookie-less 未來
二、核心內容
2-1 客戶分群(Customer Segmentation)
生活比喻:超市會把常客、偶爾購物者、只在特價時出現的顧客分開對待——AI 做的事一樣,只是更精準、更即時、更大規模。
RFM 模型是零售業最經典的客戶分析框架,三個維度分別是:
| 維度 | 英文 | 意義 |
|---|---|---|
| 近度 | Recency (R) | 距今最近一次購買的天數(越短越好) |
| 頻率 | Frequency (F) | 一段時間內的購買次數(越多越好) |
| 金額 | Monetary (M) | 累計消費金額(越高越好) |
每位顧客在 R、F、M 三個維度各取得一個分數,合併後形成「顧客輪廓分數」,可直接用來分群或預測流失風險。
K-Means 分群則是 RFM 資料的常見搭配演算法:
- 隨機設定 K 個群心(Centroid)
- 每位顧客被分配到距離最近的群心
- 重新計算每群的平均位置作為新群心
- 重複直到群心不再移動
生活比喻:K-Means 就像在地圖上找「服務最多居民」的便利商店最佳位置——每次根據現有客群重新校正位置,反覆迭代直到最優。
K-Means 分群後,行銷團隊再為每個群貼上**人物誌(Persona)**標籤,例如「高價值忠誠客」、「沉睡客」、「價格敏感型」,針對性設計再行銷方案。
2-2 商品推薦系統(Product Recommendation)
推薦系統是 Amazon、Netflix、YouTube 的核心 AI 武器,主要三種方法:
協同過濾(Collaborative Filtering)
生活比喻:「和你口味相似的人還買了這個。」——找到行為相近的使用者或商品,互相借用評分。
- 使用者-使用者協同過濾(User-User CF):找到與你購買行為相似的使用者群,推薦他們買過但你還沒買的商品
- 商品-商品協同過濾(Item-Item CF):計算商品之間的相似度,「買了 A 的人也常買 B」
| 優點 | 缺點 |
|---|---|
| 不需要商品內容資訊 | 冷啟動問題嚴重(新商品/新用戶無資料) |
| 能發現意外的好推薦(驚喜感) | 資料稀疏時效果差 |
內容過濾(Content-Based Filtering)
根據商品本身的屬性(類別、品牌、描述、關鍵字)與使用者過去喜好的商品屬性進行配對:
- 你看了很多科幻小說 → 推薦更多科幻類書籍
- 你買了 Nike 跑鞋 → 推薦 Nike 其他運動用品
| 優點 | 缺點 |
|---|---|
| 不受冷啟動影響(只需商品資訊) | 推薦結果缺乏驚喜感(同質性高) |
| 可解釋性強 | 依賴高品質商品標籤 |
DeepFM 與深度推薦模型
現代大型推薦系統(如 Amazon、抖音)普遍採用混合深度模型,代表架構 DeepFM 結合:
- FM(Factorization Machine):捕捉使用者-商品特徵的二階互動
- DNN(深度神經網路):捕捉高階非線性特徵組合
輸入特徵(用戶ID, 商品ID, 類別, 歷史行為, 時間...)
↓
FM 部分 + DNN 部分
↓
CTR 預測(點擊率)
Netflix 的推薦系統同時考慮觀看歷史、觀看時長、暫停行為、一天中的時段等多維度訊號,遠超簡單的「評分預測」。
冷啟動問題(Cold Start Problem)與解決策略
| 問題類型 | 情境 | 解決策略 |
|---|---|---|
| 新用戶冷啟動 | 剛註冊的使用者,無歷史資料 | 引導填寫偏好問卷、使用人口統計資料推薦熱門商品 |
| 新商品冷啟動 | 剛上架商品,無互動紀錄 | 依商品屬性(內容過濾)、人工加入推薦位 |
| 系統冷啟動 | 全新平台 | 使用熱門排行榜、編輯精選、社群口碑 |
2-3 動態定價(Dynamic Pricing)
生活比喻:Uber 在下班尖峰時段或下雨天,車費自動漲價(Surge Pricing)——背後是即時需求預測 + 定價最佳化 AI。
動態定價 = 需求預測(Demand Forecasting) + 定價最佳化(Price Optimization)
需求預測常用技術:
- 時間序列模型(ARIMA、Prophet)預測未來需求量
- 梯度提升樹(XGBoost、LightGBM)融合多種特徵(節日、天氣、競品價格)
定價最佳化目標:在最大化收益的同時不流失顧客,常見策略:
| 策略 | 說明 | 範例 |
|---|---|---|
| 需求彈性定價 | 需求高時提價,需求低時降價 | 航空機票、飯店房價 |
| 競品跟價 | 即時監測競品價格並自動調整 | 電商平台商品比價 |
| 個人化定價 | 依顧客 CLV 或行為給予不同折扣 | 會員專屬優惠 |
| 庫存清倉定價 | 庫存過多時自動降價促銷 | 生鮮食品、季末服裝 |
考試陷阱:動態定價雖合法,但若對不同族群(如種族、性別)給出差異定價,可能觸犯反歧視法規。
2-4 廣告投放與最佳化(Ad Targeting & Optimization)
相似受眾(Lookalike Audience)
生活比喻:你的最佳客戶是 35 歲、喜歡健身、月收入 8 萬的雙北上班族,AI 在全平台找出「最像他們的人」,擴大投放。
Meta(Facebook)和 Google Ads 的 Lookalike 功能步驟:
- 上傳種子受眾(Seed Audience):你的購買名單或高價值客戶清單
- AI 分析種子受眾的共同行為特徵、興趣、人口屬性
- 在更大的用戶池中找出相似用戶,作為廣告投放目標
CTR 預測(Click-Through Rate Prediction)
廣告平台的核心模型,預測某用戶看到某廣告時的點擊機率:
CTR 預測模型輸入:
- 用戶特徵(年齡、性別、過去行為)
- 廣告特徵(類別、文案、創意素材)
- 情境特徵(時段、裝置、位置)
↓
輸出:點擊機率分數 → 決定廣告競價與排序
廣告拍賣公式(Google 廣告排名):廣告排名 = 出價 × 品質分數(Quality Score)
A/B 測試自動化
傳統 A/B 測試需人工等待顯著性,現代 AI 平台採用**多臂吃角子老虎機(Multi-Armed Bandit)**算法自動分配流量:
| 方法 | 說明 |
|---|---|
| 傳統 A/B 測試 | 50/50 分配流量,等收集足夠樣本後再決定勝者 |
| Multi-Armed Bandit | 即時依表現動態分配更多流量給較好的版本,減少損失 |
| Epsilon-Greedy | 90% 時間選最佳版本,10% 時間隨機探索新版本 |
2-5 對話式商務(Conversational Commerce)
生活比喻:以前要逛完整個賣場才能找到想要的東西,現在跟 AI 說一句「我需要防水適合登山的中筒鞋,預算 3000 以內」,它直接幫你篩選推薦。
**聊天行銷機器人(Chatbot Marketing)**的主要應用:
| 應用 | 說明 | 平台範例 |
|---|---|---|
| 個人化訊息推播 | 依用戶行為發送客製化優惠 | LINE 官方帳號 AI |
| 即時客服 + 導購 | 回答問題並直接促成購買 | WhatsApp Business AI |
| 廢棄購物車挽回 | 偵測未結帳行為,自動發送提醒 | Shopify + 聊天機器人 |
| 問卷與偏好蒐集 | 對話式引導收集用戶資料 | 品牌 LINE Bot |
**個人化訊息(Personalized Messaging)**不只是插入名字,而是根據:
- 購買歷史
- 瀏覽行為
- 地理位置
- 購買時間偏好
動態生成每位顧客專屬的訊息內容、優惠品項與發送時機。
2-6 顧客終身價值(Customer Lifetime Value, CLV)預測
生活比喻:一個每週來喝珍奶的常客,和一個只在開幕特價來過一次的顧客,值得花一樣多的行銷預算嗎?CLV 幫你算清楚。
CLV 的基本概念:
CLV = 平均購買金額 × 購買頻率 × 顧客預期留存時間
AI 預測 CLV 的進階做法:
- 使用BG/NBD 模型(Beta-Geometric/Negative Binomial Distribution)預測未來購買次數
- 結合深度學習預測個別顧客的未來消費行為
- 高 CLV 顧客 → 給予優先客服、專屬優惠;低 CLV 顧客 → 採用低成本自動化服務
2-7 隱私保護與 Cookie-less 未來
生活比喻:以前廣告公司像個跟蹤狂,用第三方 Cookie 追蹤你走到每個網站;現在瀏覽器開始限制,廣告公司必須改用更「君子」的方式蒐集資料。
第三方 Cookie 的消亡:
- Google Chrome 宣布逐步淘汰第三方 Cookie
- Apple Safari 已全面封鎖跨站追蹤(ITP)
- 廣告精準度下降,傳統再行銷模式受衝擊
因應策略:資料來源分層策略
| 資料類型 | 來源 | 說明 |
|---|---|---|
| 零方資料(Zero-Party Data) | 顧客主動提供 | 問卷、偏好設定、遊戲化互動 |
| 第一方資料(First-Party Data) | 自有平台蒐集 | 官網行為、購買紀錄、APP 資料 |
| 第二方資料(Second-Party Data) | 合作夥伴分享 | 聯名卡、異業合作資料交換 |
| 第三方資料(Third-Party Data) | 外部資料商 | Cookie 追蹤、DMP 資料(逐漸淘汰) |
未來的精準行銷將更依賴:零方 + 第一方資料 + Privacy-Preserving AI(如聯邦學習、差分隱私)。
三、關鍵名詞中英對照
| 中文 | 英文 |
|---|---|
| 客戶分群 | Customer Segmentation |
| 近度-頻率-金額模型 | RFM Model (Recency, Frequency, Monetary) |
| 人物誌 | Persona |
| 協同過濾 | Collaborative Filtering |
| 內容過濾 | Content-Based Filtering |
| 冷啟動問題 | Cold Start Problem |
| 點擊率 | CTR (Click-Through Rate) |
| 動態定價 | Dynamic Pricing |
| 需求預測 | Demand Forecasting |
| 波動定價 | Surge Pricing |
| 相似受眾 | Lookalike Audience |
| 多臂吃角子老虎機 | Multi-Armed Bandit |
| 對話式商務 | Conversational Commerce |
| 顧客終身價值 | CLV (Customer Lifetime Value) |
| 零方資料 | Zero-Party Data |
| 第一方資料 | First-Party Data |
| 第三方 Cookie | Third-Party Cookie |
| 聯邦學習 | Federated Learning |
| 差分隱私 | Differential Privacy |
| 廢棄購物車 | Cart Abandonment |
四、考試重點提示
重點 1:RFM 三個字母的意義 R = Recency(近度,越近越好)、F = Frequency(頻率,越多越好)、M = Monetary(金額,越高越好)。RFM 常搭配 K-Means 進行客戶分群。
重點 2:協同過濾 vs. 內容過濾的冷啟動 協同過濾對新用戶和新商品都有冷啟動問題(無歷史互動資料);內容過濾只需商品屬性資料,對新商品冷啟動問題較小,但推薦缺乏驚喜感。
重點 3:動態定價的法律紅線 動態定價本身合法,但若因種族、性別等受保護特徵造成差異定價,可能違反反歧視法。考題常以「Uber Surge Pricing」或「航空機票」為情境。
重點 4:Multi-Armed Bandit vs. A/B 測試 傳統 A/B 測試平均分配流量直到統計顯著;Multi-Armed Bandit 即時學習,動態將更多流量分給表現較好的版本,減少測試期間損失。
重點 5:零方資料 vs. 第一方資料 零方資料(Zero-Party Data)是顧客「主動」提供(如填寫偏好問卷);第一方資料(First-Party Data)是平台「被動蒐集」(如網站行為追蹤)。兩者都是 Cookie-less 時代的核心資產。
1. 電商平台分析顧客資料,發現某用戶 90 天內購買 1 次、總消費金額 500 元;另一用戶 7 天內購買 5 次、總消費金額 8000 元。若以 RFM 模型評分,哪位顧客的 R、F、M 分數較高?這對行銷策略有何意義?
2. Netflix 向新註冊用戶推薦節目時,遇到什麼問題?下列哪個解決方式最適合處理「新用戶冷啟動」?
- (A) 等用戶看夠多再開始推薦
- (B) 引導用戶填寫喜愛類型問卷,並推薦該類型熱門內容
- (C) 改用協同過濾,但需要大量歷史互動資料
- (D) 只推薦平台上評分最高的 10 部影片給所有新用戶
3. Uber 在大型演唱會散場時自動調高車費,這是什麼定價策略?背後依賴什麼 AI 技術?
4. 某品牌在 Meta 廣告平台上傳了 1 萬名「過去 6 個月內重複購買」的顧客名單,請問這個功能叫什麼?它的目的是什麼?
5. 隨著第三方 Cookie 逐漸被淘汰,一家電商公司決定強化會員問卷、讓顧客自選通知偏好、設計積分換贈品活動來蒐集資料。這些資料屬於哪種類型?為何它在 Cookie-less 時代特別重要?
解答與解析
| 題號 | 答案 |
|---|---|
| 1 | 第二位用戶 R、F、M 均較高,應列為高價值客戶,優先分配行銷資源 |
| 2 | (B) |
| 3 | Surge Pricing(波動/動態定價),依賴需求預測模型 + 即時定價最佳化 |
| 4 | 相似受眾(Lookalike Audience),目的是擴大觸及與現有優質客戶行為相似的潛在新客 |
| 5 | 零方資料(Zero-Party Data),顧客主動提供,不涉及追蹤,合規性最高且信任度最強 |
詳細解析:
第 1 題: RFM 模型中,第二位用戶的 R 分(7 天前購買,極近)、F 分(5 次購買)、M 分(8000 元)均遠優於第一位(90 天前、1 次、500 元)。第一位用戶可能已流失,應採用「喚回策略」;第二位是高價值活躍客,應優先給予維繫和升級方案(如 VIP 升等、專屬客服)。
第 2 題:(B) 協同過濾需要用戶的歷史互動資料,新用戶完全沒有,因此冷啟動問題嚴重(排除 C)。僅推薦全平台最熱門內容(D)沒有個人化,體驗差。等用戶看夠多再推薦(A)會造成糟糕的初始體驗。最佳解是讓用戶主動表達偏好(B),再結合熱門內容進行推薦。
第 3 題: 這是Surge Pricing(波動定價),屬於動態定價的一種。背後依賴:1) 需求預測模型(偵測到該時段、地點需求激增);2) 即時定價最佳化(自動計算可最大化收益的價格乘數),並在 App 前端即時呈現給司機和乘客。
第 4 題: 這個功能是 Meta 廣告的Lookalike Audience(相似受眾)。AI 分析這 1 萬名優質顧客的共同行為特徵,在 Meta 平台的更大用戶池中找出行為相似的人,讓廣告主能以有限預算觸及最有可能成為新顧客的受眾,提升廣告投資報酬率(ROAS)。
第 5 題: 這些資料屬於零方資料(Zero-Party Data)——顧客透過問卷、偏好設定、積分活動「主動告知」品牌的資訊。相比被動追蹤的第三方 Cookie,零方資料:1) 完全合規(顧客知情且同意);2) 資料品質高(顧客主動表達真實偏好);3) 不受瀏覽器政策限制。在 Cookie-less 時代是最具價值的行銷資料來源。