如果你是資料分析師或產品經理,肯定超常被問到這種問題:

週一早上的產品會議,你盯著螢幕上的數據報表:上週的 30 日留存率從 45% 下降到 40%,足足掉了 5 個百分點。主管皺眉問道:「是新功能有 bug?還是使用者體驗沒設計好?」
你開始逐一檢查產品更新紀錄、錯誤報告、客戶回饋,但所有指標都顯示正常。直到你將數據按照「用戶來源」拆解,才發現真相:美國用戶的留存率依然穩定在 50%,新進入的東南亞市場用戶留存率也同樣是 35%,兩個主要市場的留存率都沒有下降,而是最近大型行銷活動、讓東南亞用戶佔比從 20% 暴增到 60%,拉低了整體留存率平均值。
這不是產品問題,而是「用戶組成改變」造成的。這個現象在資料分析領域稱為:Mix-Shift,也稱為 Composition Effect(組合效應)。
用 Mix-Shift 來解析指標變化的技巧,在我 過去的求職經驗 之中,幾乎是資料科學家面試必考題目之一。
這篇學習筆記將分享如何善用 Mix-Shift 分析法,精準判斷指標變化是「產品真的有問題」還是「用戶組成改變」,避免誤解指標、浪費資源修復不存在的問題,並且介紹為什麼辛普森悖論可能會害你得到完全與事實相反的結論。
什麼是 Mix-Shift?#
Mix-Shift 是指群體組成的比例發生變化,導致整體平均指標產生波動,而各子群體的自身內在表現(Inner Effect / Inherent Changes)維持不變。
用更直白的比喻:班上的平均成績下降了,不見得是因為學生變笨,也可能是因為「資優生」和「普通學生」的人數比例改變。如果資優生從佔比 80% 減少到 20%,即使每個人的成績、用功程度都沒變,班級平均分數自然會下降。
筆者個人還喜歡用一個很拗口的說法:「平均是平均的平均」,你看到的單一個平均數,其實是很多平均數的加權平均數。以班級成績為例,全班成績平均數會是資優生的成績平均數以及普通學生成績平均數的加權平均,而 Mix-Shift 要講的概念很簡單:全班成績平均數下降,不只可能是同學最近都在打混,也有可能單純是有幾位學霸最近轉學了。

這個分析方法是各行各業的數據專家必備技能。例如 Sequoia Capital(紅杉資本)的資料科學團隊將 Mix-Shift 明確列為衡量指標變動的主要因素之一;Google 的資料分析最佳實踐指南 也明確使用 Mix-Shift 這個術語來診斷指標異常;Mix-shift 在科學領域則會稱為 Composition Effect。
Mix-Shift 分析的核心價值在於幫助我們區分人口組成變化的影響與用戶內在(行為)變化的影響。如果搞錯問題來源,就會做出錯誤決策。
Mix-Shift 的常見類型#
在商業分析中,Mix-Shift 通常出現在以下維度:
- 用戶特徵:不同國家、地區、平台、年齡、性別的用戶比例變化
- 產品組合:不同產品線、定價方案、功能模組的銷售比例變化
- 渠道組合:不同流量來源、行銷渠道、合作夥伴的用戶佔比變化
但問題來了:用戶特徵、產品組合、渠道組合 … 我該從哪個維度開始分析?
(´・Д・)
以下分享兩個基本判斷原則:
判斷原則 1:商業模式#
你的商業模式重心在哪裡,就從哪個維度開始:
- B2C 電商/消費性產品:優先看用戶特徵(地區、年齡、設備)和產品(類別、價格帶)組合變化,例如 Amazon 如果 Bazaar 平價購物 快速擴張、全電商的平均客單價理應會下降
- B2B SaaS:優先看客戶類型(企業規模、產業別)和定價方案(Basic/Pro/Enterprise)組合變化
- 內容/社群平台:優先看用戶行為特徵組合變化,例如不同活躍度的分層、內容偏好;渠道組合也很重要(自然流量/付費流量)
以我自己的工作經驗為例,以前在手遊產業的時候,非常重視國家別維度,因為有些遊戲類型就是比較合特定國家玩家的胃口,所以留存率有不小的國家別差異。
判斷原則 2:近期策略方向#
如果你的公司最近有重大策略調整,那個調整就是最該檢查的維度:
- 最近開拓新市場 → 看「國家、地區」的組合變化
- 最近推出新定價方案 → 看「產品價格帶」的組合變化
- 最近投放新廣告渠道 → 看「渠道」的組合變化
- 最近改變目標客群 → 看「性別、年齡」的組合變化
在實務上,問題經常不是單一維度那麼簡單。更好的做法是多維度解讀 Mix-Shift。例如:你發現整體留存率下降,按「地區」拆解後發現東南亞用戶佔比增加,數據故事還沒完!我們要繼續問:
- 東南亞用戶是從哪個「渠道」來的?
- 他們主要使用哪個「平台」?
- 他們訂閱了哪個「定價方案」?
這種多維度交叉分析能幫你找到更精準的行動方案。例如:不只是「東南亞用戶留存率低」,而是「透過 Facebook 廣告來的東南亞 Android 用戶留存率低」,這樣你就知道該最佳化 Facebook 廣告素材或 Android App 的東南亞使用者體驗。
為什麼 Mix-Shift 如此重要?#

1. 資料分析必備技巧:精準診斷問題根源#
當整體指標發生變化時,Mix-Shift 分析能幫助我們回答一個關鍵問題:
指標開始變化,是因為「產品本身的問題」(Inner Effect)還是「用戶結構改變」(Mix-Shift)?
以我的專業且主觀的經驗,你看到的指標變化多半會來自後者的用戶結構改變,因為要讓產品本身或使用者行為產生改變很不容易!一來,指標很難提升,不是人人都像 Steve Jobs 是產品設計大師,我們很難在短期改動快速增加留存率或付費率,學術研究顯示 60% 以上的產品改動決策都是無用的;二來,指標也不會輕易變難看,畢竟,沒有員工會想搞砸產品來跟自己的績效獎金過不去,大家都很小心的。
如果沒有 Mix-Shift 分析,就可能把「組成改變」誤判為「產品問題」,導致團隊浪費大量資源去修復一個根本不存在的問題。更糟的是,可能會停止一個其實很成功的商業策略,這就連結到下一點要說的決策誤判:
2. 避免決策誤判:不要把好事當壞事#
Mix-Shift 的另一個重要價值是:它能避免管理層因為「看錯數字」而做出錯誤決策。
舉例來說,當公司成功進入新市場、吸引了大量新用戶時,整體平均客單價可能會下降。光是看到「下降」可能會造成團隊不小恐慌,但這不代表產品定價失敗或用戶價值降低!而是因為新市場的消費力較低。
如果你身為資料分析師或產品經理不理解 Mix-Shift、沒有精確地向管理層溝通數字背後的故事,可能只是因為平均客單價下降而徒增恐慌,甚至叫停原本很成功的市場擴張計畫。
3. 產品經理與資料科學最常被問的面試題#
「為什麼某個指標下降了?」這是產品經理和資料分析師面試中的經典問題。面試官想測試的不只是你會不會看數據,更重要的是:你能不能有系統地拆解問題,找出真正的原因。
Mix-Shift 分析是回答這類問題的核心框架之一。一個好的回答應該包含:
- 檢查數據品質是否有問題
- 將總體指標按維度拆解(例如:按國家、平台、用戶類型)
- 計算並量化 Mix-Shift 效應
- 判斷變化是來自組成改變,還是內在表現變化
(延伸閱讀:資料科學家面試常問問題有哪些?)
光是羅列 Mix-Shift 的重要性,可能聽起來有點模糊?我們接著用幾個(假想)商業案例來理解 Mix-Shift 對於分析的實際幫助。
商業範例 1,用 Mix-Shift 偵測問題:SaaS 訂閱流失率飆升#
某 SaaS 公司的產品經理發現,過去三個月的月訂閱流失率(Churn Rate)從 3% 上升到 5%,看起來非常糟糕。團隊開始檢討是不是產品功能出了問題,或者客戶服務品質下降。
但當資料分析師將流失率按「客戶類型」拆解後,發現:
- 企業客戶(大型公司):流失率維持在 1%,沒有變化
- 中小企業客戶:流失率維持在 5%,也沒有變化
問題出在哪?原來過去三個月公司的市場策略調整,開始大量獲取中小企業客戶,導致中小企業客戶的比例從 30% 增加到 70%。由於中小企業本來流失率就較高(5%),當他們的比例增加時,整體平均流失率自然被拉高了。
結論:流失率上升不是 SaaS 產品問題,而是客戶組成改變的結果。這個 Mix-Shift 分析避免了團隊錯誤地把資源投入「尋找並修復『不存在』的產品問題」,而是應該聚焦在:如何針對中小企業客戶設計更適合的留存策略。
商業範例 2,用 Mix-Shift 發想策略:功能最佳化的投資決策#
某社群平台(類似 Facebook、Instagram)想要提升整體用戶參與度(Engagement),資料團隊觀察到「發文」功能的使用率在過去半年從 40% 提升到 50%,貌似是個好消息。
但進一步做 Mix-Shift 分析後,發現:
- 年輕用戶(18~25 歲):發文使用率從 60% 提升到 70%
- 中年用戶(35~50 歲):發文使用率從 20% 提升到 25%
這個維度分解揭示了兩個更深層的洞見:
- 內在提升:兩個用戶群體的發文意願都在增長,代表產品改進確實有效
- 策略機會:中年用戶的發文率雖然有成長,但絕對值仍然很低(25%),代表這個群體有巨大的成長空間
策略建議:基於這個 Mix-Shift 分析,產品團隊決定針對中年用戶設計更友善的發文引導流程和內容建議功能,因為這個群體的參與度「成長潛力」最大。如果能將中年用戶的發文率從 25% 提升到 40%,對整體平台參與度的貢獻,會遠大於繼續最佳化已經表現很好的年輕用戶群體。
極端案例:辛普森悖論,讓數字完全反轉?!#
Mix-Shift 的極簡化說法,是請你分析「分組」之後的資料。而 Mix-Shift 最極端的案例,正是著名的 辛普森悖論(Simpson’s Paradox),它描述了令人匪夷所思的數據結果:
分組後看資料 vs. 合併後看資料
會看到完全相反的資料趨勢

讓我們用一個電商平台的客單價案例來說明:
假設有兩個電商平台 A 和 B,都銷售「高單價商品」和「低單價商品」兩類產品。我們來比較它們的平均客單價表現,想用平均客單價來判斷哪個平台比較賺錢。
平台 A 的數據:
| 商品類型 | 訂單數 | 平均客單價 |
|---|---|---|
| 高單價商品 | 100 單 | 1,000 元 |
| 低單價商品 | 900 單 | 100 元 |
| 總計 | 1,000 單 | 190 元 |
算法:(100 * $1000 + 900 * $100)/1000 = $190 |
平台 B 的數據:
| 商品類型 | 訂單數 | 平均客單價 |
|---|---|---|
| 高單價商品 | 900 單 | 800 元 |
| 低單價商品 | 100 單 | 80 元 |
| 總計 | 1,000 單 | 728 元 |
分組比較(各別商品類型):
- 高單價商品:A 平台(1,000 元)> B 平台(800 元),A 平台勝 ✓
- 低單價商品:A 平台(100 元)> B 平台(80 元),A 平台勝 ✓
看起來 A 平台在兩個品類都完勝 B 平台,所以我可以結論 A 平台比較賺錢,對吧?
但當我們看總平均客單價時,結果卻反轉了:
- A 平台總平均:190 元
- B 平台總平均:728 元
B 平台的總平均客單價竟然遠高於 A 平台!
為什麼會這樣?關鍵在於訂單組成的比例完全不同,這正是本篇文章探討的 Mix-Shift 組成問題:
- A 平台:90% 是低單價訂單,只有 10% 是高單價訂單
- B 平台:只有 10% 是低單價訂單,而 90% 是高單價訂單
即使 A 平台在兩個品類的客單價都更高,但因為它的訂單組成嚴重偏向低單價商品,所以總平均被大量低單價訂單拉低了。這就是辛普森悖論的典型案例。
還記得前面些略提到,Amazon 在台灣從 2025 年開始熱烈推廣的 平價購物平台 Bazaar,是不是有點像範例的平台 A?如果你是 Amazon 的分析師,是不是更該小心用 Mix-Shift 方法看全公司數據了?
再一次強調,辛普森悖論是 Mix-Shift 的極端案例,組成變化很少會大到造成這種悖論(趨勢反轉)發生,然而,Mix-Shift 跟辛普森悖論兩者無疑都是對商業決策的重要啟示:
在這個案例中,如果你只看總平均客單價,你會認為 B 平台的商業模式更好;但如果你看分組數據,會發現 A 平台在產品定價和價值創造上其實更優秀,只是銷售組合不同而已。
正確的分析方法是:
- 記得要拆解數據,按關鍵維度分組觀察
- 理解組成比例(Mix)對總體指標的影響
- 根據商業目標,決定應該關注哪個層級的指標
Mix-Shift 就是辛普森悖論在商業分析中的實際應用,它提醒我們時刻警惕「組成變化」對指標的影響。
結語#
掌握 Mix-Shift,是在任何資料分析相關工作混飯吃的基本功,不論你是商業顧問、科技業產品經理、數位行銷專家,都必須要懂 Mix-Shift。
Mix-Shift 分析不只是一個統計技巧,更是一種批判性思維。它訓練我們在看到指標變化時,不要急著下結論,而是先問自己:這個變化,有多少是來自組成改變?有多少是來自產品或使用者行為的內在表現變化?
下次當你面對任何指標變化時,記得這個基本的分析框架:先拆解、再比較。
如果你想更深入理解數據如何被誤用、如何避免被數字欺騙、或者更多像是辛普森悖論這種反直覺的數據解讀謬誤,推薦閱讀《數據的假象》這本輕鬆好讀的科普書,它會幫助你建立更健全的數據素養,在這個充滿數據的時代做出更明智的決策。


