2025 年將至尾聲,回顧這一年在公司內的努力,最大的成就是在 Data Science Summit 上台分享 Pixel 的因果推論專案。
Google 內部每年都會舉辦 Data Science Summit(資料科學高峰會),全公司幾百位資料科學家都會在這個盛事投稿、分享自己近期的專案與研究。今年,我把自己做的 Pixel 智慧手錶因果效果研究拿去投稿,不只是有幸獲選、和我的主管一起在超過百人觀眾的舞台演講,更獲選為今年的最佳演講之一。我很高興努力的成果受到眾多資深資料科學家的認可。
幾週後,當我有機會把同樣的研究分享給成員更廣泛的 Pixel 團隊時,我(多次掙扎後)刪掉了所有技術細節,那些讓我得獎的統計與計量經濟內容全都在簡報內消失。矛盾的是,正是這個「零技術」的簡報版本,讓我的專案受到上層認可、為專案爭取到了更多資源和支持。
這是我 2025 年親身體驗到重要的一課:影響力不只是用技術深度換來的,更需要用對的語言、向對的人、說對的事。
我將在這則筆記分享我在這段實戰經歷中的學習心得。

同一個分析、三種說法#
我的因果推論研究使用 DoubleML 方法,分析 Pixel 手錶與耳機對於 Pixel 生態系與品牌的正向影響力,也就是探討使用 Pixel 智慧手錶如何「造成」Pixel 手機使用者更加熱愛這個品牌。這個專案讓我有機會在三個完全不同的場合演講。每次我都必須重新思考該說什麼。
第一場:Data Science Summit#
這是最初、也是最主要的舞台。Google 內部所有資料科學家,每年都會在這個資料科學高峰會齊聚一堂、交流經驗,我今年跟主管的合作投稿,有幸獲選並上台,在超過百位專業分析師面前演講。
既然聽眾全都是資料科學家,我當然傾全力研究並分享技術專業。我在演講中花了大量時間解釋 DoubleML 方法論、因果分析框架與假設、甚至深入討論背後的數學基礎:FWL theorem(Frisch-Waugh-Lovell theorem)如何驅動整個演算法。
令我欣喜若狂的是:我們獲獎了,獲選為今年的高峰會最佳演講之一,因為評審認為我在技術深度和商業影響力之間的內容規劃取得了完美平衡。
也因為這項小成就,讓我獲得更多公司內曝光的機會,而這也是新挑戰的開始。
為什麼資料科學高手都略懂 FWL Theorem?(點擊展開)
Frisch-Waugh-Lovell Theorem 是因果推論與計量經濟學中一個極其強大的工具,它的核心思想是「Partialling-out」或「正交化(Orthogonalization)」。它能讓你從複雜的數據中隔離出某個變數的獨立影響,使其看起來就像是經過隨機分配的實驗一樣。
DoubleML 跟 CUPED 實驗 這些進階且強力的實戰方法,都以 FWL Theorem 為核心。
第二場:數據分析團隊#
我所在的 Pixel 分析團隊(至少 30 位)也關注到我的因果推論報告,因此邀請我在團隊分享相同內容。

受邀分享後,主管鄭重地提醒我:要注意聽眾不一樣了。即使職稱都是數據分析師、資料科學家,Pixel 團隊的分析師們背景依然很多元,有些做質性研究、有些做量化、有些人擅長商業策略,換句話說,我不能像上一場一樣,大談數學理論與計量經濟學。
所以,我開始抽象化、大改簡報。FWL theorem 被壓縮成兩句話「DoubleML 背後有 FWL theorem 支持,它能有效控制干擾變項」、演講簡報的數學公式大量減少、改用流程圖呈現分析過程。
我一邊修著簡報、一邊擔心自己過度地抽象化,會讓人覺得內容不夠深、搔不到癢處,但在這第二場演講收到許多正向回饋後,我才發現我多慮了。
故事到這裡還沒結束,不知該高興還是該難過,因為這場同樣獲得好評的演講,我被邀請向更大的組織分享。
(延伸閱讀:為什麼需要 DoubleML 這種因果推論方法?)
第三場:Pixel 策略組織#
這是最大的挑戰。受眾包含完全非技術背景的營運、行銷、和商業策略專家,甚至 Pixel 策略組織總監也會出席。
受眾非常顯然又更廣泛了,我再次修改簡報、做了最激進的簡化:DoubleML?一個字都沒提;因果分析需要什麼假設?我想也不會有人有耐心聽;更別說什麼 FWL theorem,這個關鍵字肯定完全消失。我只談「為什麼」:
- 為什麼要做這個專案
- 挑戰、專案難點是什麼
- 商業影響力有多大
整場演講最「技術」的用詞就只有「A/B Testing」,夠抽象了吧。跟統計方法直接相關的簡報,我只濃縮成一句話:「因為相關不等於因果,而且 Pixel 硬體銷售顯然不能做 A/B 測試,所以我們團隊採用了因果推論方法來突破這個難點」
我當下寫完這頁簡報,連我自己都質問自己:「就這樣?就扔下一句『因果推論方法』?是什麼方法都不用解釋一下嗎?」
連我自己都很意外地,在這場演講後,主管告訴我,他收到很多來自組織不同成員的正向評價,大家都感受到這份分析報告的價值,讓數據真正為團隊爭取到資源、讓組織都認可「這個專案應該擴大規模」。
而這一切,都源自於大家「聽得懂」數據,這是我最大的體悟。
掙扎後,更深的體悟#
在準備第二、三場演講時,我內心非常掙扎。
最初版簡報中,那些酷炫的 FWL theorem、強大的 DoubleML 方法,不只是基於我對這些優雅方法的熱情,我為了贏得資深資料科學家聽眾的認可、也為了對得起自己的專業,我花了 超 級 多 時間準備簡報,翻課本、讀論文、問 AI,各項細節都再三檢查、深怕自己的方法論講解不夠清楚。
而到了之後兩次的簡報,我卻像是在刻意隱藏這些技術細節的存在。我甚至覺得有點愧疚,我是不是會自曝其短?只講自己「方法很棒」卻不講清楚方法的細節,不是跟神棍一樣嗎?
寫到這裡,我想起最近在看的《怪奇物語》第一季,惠勒太太說了些話、但對方不聽,她抱怨:「Am I speaking Chinese in this house?」

言下之意是:「我講的是外星語嗎?你怎麼都聽不懂?」。在演講、或是數據分析報告也是同樣道理,如果受眾聽不懂我的語言,再重要的內容對他們來說都沒意義、都聽不進去。
對不懂統計的聽眾來說,解釋 DoubleML 就是在說外星語。
同樣數據內容我報告了三次,這三場演講中我體悟到:調整溝通方式不是單純的妥協,而是針對戰場「選對武器」:
- 在第一場 Data Science Summit,我的戰場是資料科學技術專業,我得盡力證明方法的嚴謹性
- 之後的分析團隊、Pixel 策略組織簡報,我的戰場是爭取資源和支持、讓專案擴大影響力,因此讓眾人聽懂商業脈絡才是最重要的
對不同戰場、要用不同武器;對不同星球的人、要講不同語言;對於不同的演講受眾、要講不同的(他們聽得下去的)重點。
講了半天,其實這些都是後見之明。準備簡報的當下,都是在掙扎到底該不該拼命「秀」出自己的技術深度,以證明自己的能力與價值。也都是要實際嘗試、挑戰、成功獲得了正面回饋後才會體悟到,原來勇敢拿掉那些我引以為傲、但不是人人都在乎的技術細節,專注在把簡報設計得直觀好懂,才能真正創造商業影響力。
給同樣掙扎的資料科學家們:三個實用建議#
說到底,其實這一切可以說是「知識的詛咒」,你認為超級珍貴的專業知識,不見得是成功推動專案的關鍵。我在此總結自己突破知識詛咒的方式:

1. 準備多個版本的專案簡報#
- (最主要)分析版:給大多數的 Stakeholders,保留核心概念,但多用流程圖或示意圖取代統計學公式
- 技術版:給資料科學家,主要用於同儕審查(Peer Review),介紹完整方法論、統計假設、數學推導等等
- 極簡版:可以短到只有一頁簡報的內容量,只談問題、解法、影響
最後這個極簡版其實就是 電梯簡報(elevator pitch)。想像你在電梯裡遇到部門總監,你只有 30 秒介紹你最自豪的專案,該怎麼最有效率地在 30 秒內發揮?這個極簡電梯簡報是在專案每個階段都要準備並不斷更新的,因為在職場上,有很多你意想不到、突然需要你起身行銷自己的時刻。
2. 建立你的「翻譯詞彙表」#
任何的技術詞彙,都要習慣「換句話說」。像是提到因果推論方法 DoubleML、Difference-in-Difference、或是 Propensity Score Matching:
❌ 不要說:「我們用 DoubleML 從多個維度控制 confounding bias」
✅ 我會說:「這些方法讓我們在不能做 A/B 測試的時候,也能得到接近 A/B 測試的分析成果」
又或者 P 值與信賴區間,我會簡化地說:「有它們的參考,資料才可信」。
這些不是學術定義、也不夠精確,但只要它們是讓非技術、來自任何領域的團隊成員都能接受的說法,那就有價值。
3. 在簡報最後留附錄#
這其實是我大部分簡報會用到的小技巧:最詳細的方法論介紹,只寫在附錄。
主要簡報的統計方法可以摘要、抽象地寫就好,真正的細節都只放在最後 5 ~ 10 頁的附錄,標注成「Technical Details (Optional)」。這樣既不會在主要簡報時讓 Stakeholders 打哈欠,也能隨時準備好資料,和對於方法論有興趣的同事深入討論。
如果你有一點數據分析從業經驗,應該都有感受到殘忍的真相是這樣的:商業戰場的節奏十分快速,Stakeholders 根本來不及(也沒興趣)在乎統計方法是否真的嚴謹。我們資料科學家得小心規劃溝通策略:用最好懂的方式講清楚專案的商業價值永遠是最重要的,最忌諱急著搬出技術細節、只是為了證明自己的實力。
結語#
在資料科學領域打滾八年多了,這些溝通方法的道理我也不是第一天知道,只是 2025 年這年的經驗,恰好讓我有比較深刻的掙扎與體悟,因此想提筆記錄下來。
真正的專業不只是懂技術,而是知道什麼時候該展示技術能力、什麼時候該收斂硬要表現的心情。
那個在 Data Science Summit 因為技術內容表達恰當而得獎的我、和那個在策略組織總監面前對 DoubleML 隻字不提的我,都是同一個我、同一份報告內容。差別是,我學著在不同時機、做好不同的角色、選擇不同的溝通方式。
如果你也熱愛資料科學,熱愛酷酷的統計學、機器學習、LLM,卻也發現為了商業溝通經常在簡化內容、覺得沒表現到自己的專業,我想告訴你:這種掙扎是正常的,資料科學這一行就是如此。有掙扎就代表我們有在思考、有在成長。
影響力,始於用對的語言、說對的事。
如果這篇文章有幫助到你,歡迎追蹤好豪的 Facebook 粉絲專頁 、 Instagram 與 Threads 帳號,我會持續分享在資料科學領域打拼的見聞;也可以點選下方按鈕,分享給喜歡數據分析的朋友們。

