【Netflix關鍵ML應用：因果分析ML框架】Netflix靠因果框架分析創意洞察，打造客製化吸睛封面

Netflix的因果框架仰賴影片封面（Artwork）使用者參與度數據和封面特徵數據，因果ML還能用來驗證假設，產出的創意洞察則供創意團隊設計新片封面參考。（圖片來源／Netflix）

推薦是Netflix經營上億會員生態圈的重要手段，大至首頁選單的行數、排序，小至每支影片的封面、精選片段和簡介都是客製化打造。Netflix最近透露，如此細緻推薦影片的一大核心技術，就是因果機器學習方法。

從圖片特徵和用戶參與度，找出成功關鍵

對Netflix來說，按觀眾喜好來呈現影音內容非常重要，比如同一支影片，不同偏好的會員會看到不同封面、簡介和預告，這不只讓使用者快速找到喜歡的影片，還能發掘有趣的新片，大大提高黏著度。也因此，Netflix自建一套個人化推薦系統，長年下來累積出龐大豐富的資料集，有影片封面的各種特徵、組成元素，還有使用者參與度數據，是用來設計新片宣傳策略的寶貴資產。

在這個基礎上，如何才能知道，哪些影片封面元素，會造就吸引眼球的影片？為找出答案，Netflix用各種方法找出洞察，也就是受歡迎的影片及其封面劇照等藝術品背後，最重要的屬性。

這時，因果ML方法就登場了。Netflix稱它為因果框架，可用來測試、驗證人類專家或電腦觀察到的現象（也就是一個假設，比如封面中出現人臉會提高觀看意願），並找出成功的創意洞察、摘要出來。

這個因果框架，使用了Netflix既有的個人化推薦系統數據，以及電腦視覺演算法產生的數據。進一步來說，藝術品個人化系統（Artwork Personalization System）是Netflix每天用來服務上億會員的個人化影片推薦系統，而驅動這個系統的，是歷年累積的使用者參與度數據，這些推薦數據和使用者參與度數據，是因果框架所需的數據來源之一。

至於電腦視覺演算法，則用於已標註的影片劇照，從中找出圖片詮釋資料（Metadata）、潛在表徵等。如此一來，因果框架使用的資料集，就包含圖片特徵和使用者參與度數據，更能用來理解哪些圖片組成，會成功吸引觀眾。

不單如此，因果框架還用來驗證假設。Netflix會先使用ML演算法、使用者行為洞察和相關性分析，來發掘圖片特徵和劇照封面美術行銷成功的高階關聯，而這些關聯，也就形成「假設」。

為了驗證，團隊會先部署因果ML演算法，來測試這個假設。若假設符合因果條件，就能經過一系列計算和評估，進而得出創意洞察，來供Netflix創意團隊參考、設計新片的個人化推薦封面等美術品。

封面出現人臉必會吸引觀眾？

透過因果ML推論，團隊得知影片封面包含一張人臉，且與片名色調一致，就能更吸引觀眾。（圖片來源／Netflix）

在過去，Netflix嘗試用A/B測試來驗證影片封面成功的因素。但這個做法有許多侷限，比如只能針對特定類型的封面，且只能手動標註特徵，難以擴展成跨類型的通用測試。這是因果框架要解決的另一大痛點。

要用因果框架驗證一個假設前，團隊得先確認，這個假設是不是一個因果推理問題。

比如，他們認為封面出現人臉，更能吸引觀眾，於是，團隊得先確認一致性，也就是電腦視覺方法能否準確偵測出大量封面中的人臉，以及這個假設是否符合其他因果條件，如假設獨立性SUTVA、無不可量測的混雜變數條件（Unconfoundedness）以及機率分配等前提。

確認符合後，團隊就能用因果ML模型來驗證這個假設。有別於一般預測性ML演算法、擅長找出數據模式以及模式與預測結果的關聯，因果ML能很好地解釋因果關係，還能縮小誤差，來評估採用假設後的結果。

目前幾種常見因果ML演算法，有Double ML、因果森林（Causal Forest）和因果類神經網路，Netflix採用Double ML和其他演算法來進行因果推論。

他們將「封面是否出現人臉」、「影片和封面特徵」等參數帶入公式，來計算最終觀眾點擊影片的機率，以及這個假設是否能套用到所有類型影片。

他們也採用調節（Mediation）和調整（Moderation）2種方法，來排除其他因素、找出封面圖片屬性之間的深度關係。比如他們發現，影片封面出現單一人臉、與片名色調一致，就能吸引觀眾，而且封面出現超過3張臉，會影響觀眾觀看意願；而在自然紀錄片中，出現人臉的效果不如其他類型的影片好。甚至，他們還根據因果推論，得知封面中人臉大小和人臉數量的最佳比例。

經因果工具驗證的結論，不僅是個人化封面設計的創意洞察，更是Netflix創意團隊用來制定新片宣傳策略的重要資產。而這些資產，最終轉化為Netflix會員的更好體驗。

相關報導

熱門新聞