推薦是Netflix經營上億會員生態圈的重要手段,大至首頁選單的行數、排序,小至每支影片的封面、精選片段和簡介都是客製化打造。Netflix最近透露,如此細緻推薦影片的一大核心技術,就是因果機器學習方法。
從圖片特徵和用戶參與度,找出成功關鍵
Netflix的因果框架仰賴影片封面(Artwork)使用者參與度數據和封面特徵數據,因果ML還能用來驗證假設,產出的創意洞察則供創意團隊設計新片封面參考。(圖片來源/Netflix)
對Netflix來說,按觀眾喜好來呈現影音內容非常重要,比如同一支影片,不同偏好的會員會看到不同封面、簡介和預告,這不只讓使用者快速找到喜歡的影片,還能發掘有趣的新片,大大提高黏著度。也因此,Netflix自建一套個人化推薦系統,長年下來累積出龐大豐富的資料集,有影片封面的各種特徵、組成元素,還有使用者參與度數據,是用來設計新片宣傳策略的寶貴資產。
在這個基礎上,如何才能知道,哪些影片封面元素,會造就吸引眼球的影片?為找出答案,Netflix用各種方法找出洞察,也就是受歡迎的影片及其封面劇照等藝術品背後,最重要的屬性。
這時,因果ML方法就登場了。Netflix稱它為因果框架,可用來測試、驗證人類專家或電腦觀察到的現象(也就是一個假設,比如封面中出現人臉會提高觀看意願),並找出成功的創意洞察、摘要出來。
這個因果框架,使用了Netflix既有的個人化推薦系統數據,以及電腦視覺演算法產生的數據。進一步來說,藝術品個人化系統(Artwork Personalization System)是Netflix每天用來服務上億會員的個人化影片推薦系統,而驅動這個系統的,是歷年累積的使用者參與度數據,這些推薦數據和使用者參與度數據,是因果框架所需的數據來源之一。
至於電腦視覺演算法,則用於已標註的影片劇照,從中找出圖片詮釋資料(Metadata)、潛在表徵等。如此一來,因果框架使用的資料集,就包含圖片特徵和使用者參與度數據,更能用來理解哪些圖片組成,會成功吸引觀眾。
不單如此,因果框架還用來驗證假設。Netflix會先使用ML演算法、使用者行為洞察和相關性分析,來發掘圖片特徵和劇照封面美術行銷成功的高階關聯,而這些關聯,也就形成「假設」。
為了驗證,團隊會先部署因果ML演算法,來測試這個假設。若假設符合因果條件,就能經過一系列計算和評估,進而得出創意洞察,來供Netflix創意團隊參考、設計新片的個人化推薦封面等美術品。
封面出現人臉必會吸引觀眾?
透過因果ML推論,團隊得知影片封面包含一張人臉,且與片名色調一致,就能更吸引觀眾。(圖片來源/Netflix)
在過去,Netflix嘗試用A/B測試來驗證影片封面成功的因素。但這個做法有許多侷限,比如只能針對特定類型的封面,且只能手動標註特徵,難以擴展成跨類型的通用測試。這是因果框架要解決的另一大痛點。
要用因果框架驗證一個假設前,團隊得先確認,這個假設是不是一個因果推理問題。
比如,他們認為封面出現人臉,更能吸引觀眾,於是,團隊得先確認一致性,也就是電腦視覺方法能否準確偵測出大量封面中的人臉,以及這個假設是否符合其他因果條件,如假設獨立性SUTVA、無不可量測的混雜變數條件(Unconfoundedness)以及機率分配等前提。
確認符合後,團隊就能用因果ML模型來驗證這個假設。有別於一般預測性ML演算法、擅長找出數據模式以及模式與預測結果的關聯,因果ML能很好地解釋因果關係,還能縮小誤差,來評估採用假設後的結果。
目前幾種常見因果ML演算法,有Double ML、因果森林(Causal Forest)和因果類神經網路,Netflix採用Double ML和其他演算法來進行因果推論。
他們將「封面是否出現人臉」、「影片和封面特徵」等參數帶入公式,來計算最終觀眾點擊影片的機率,以及這個假設是否能套用到所有類型影片。
他們也採用調節(Mediation)和調整(Moderation)2種方法,來排除其他因素、找出封面圖片屬性之間的深度關係。比如他們發現,影片封面出現單一人臉、與片名色調一致,就能吸引觀眾,而且封面出現超過3張臉,會影響觀眾觀看意願;而在自然紀錄片中,出現人臉的效果不如其他類型的影片好。甚至,他們還根據因果推論,得知封面中人臉大小和人臉數量的最佳比例。
經因果工具驗證的結論,不僅是個人化封面設計的創意洞察,更是Netflix創意團隊用來制定新片宣傳策略的重要資產。而這些資產,最終轉化為Netflix會員的更好體驗。
熱門新聞
2024-12-08
2024-12-08
2024-11-29
2024-12-08