eBay舊有推薦系統架構概覽,原則上是比較主商品與眾多商品的特徵嵌入向量,並依照嵌入向量距離遠近來排序推薦商品。(圖片來源/eBay)

商品推薦是零售業的核心課題。從實體商店將類似或互補商品陳列在一起,到現今電商以數據驅動RMN廣告,「如何呈現出顧客會有購買興趣的商品」,是一個不同時代有不同答案的亙古問題。

有2兆元交易額、1.35億名活躍會員、17億項商品的電商平臺eBay,正在嘗試交出新時代的答案卷。

「電商領域中,99%個人化推薦系統還在用老舊的典範──把商品相似性當作關聯性。」eBay AI長Nitzan Mekel-Bobrov直言。

早在2010年,eBay工程部落格的開站文章中,當時的eBay數據探勘主管Junling Hu便提到,他們新引入了協同過濾(Collaborative Filtering),將購買紀錄相似的顧客分群,再推薦分群中不同顧客曾購買的商品給彼此,是當時相似性推薦的主流技術。

這15年間,隨著技術進步,他們開始逐漸開始應用機器學習、深度學習等技術來強化推薦系統,更於2021年,聘任首任AI長Nitzan Mekel-Bobrov,主導商品推薦在內的AI做法。

eBay AI長分別在Boston Scientific、Capital One跟Booking.com等不同領域的大型企業擔任了超過13年高階數據工程主管,不過過往並沒有零售業經驗。剛加入eBay時,他聽說零售業界強調個人化推薦,且有AI模型可以預測顧客間相似度,感到非常好奇。「結果我花了一個月研究,才發現這種說法根本是認知失調。」他不諱言。

Nitzan Mekel-Bobrov認為,零售業絕大多數的推薦模型,仍是基於商品相似性2大原則:第一個是先前提到的協同過濾,第二則是內容過濾(Content-based Filtering),比前者更加簡單,單純依據商品特徵相似度來推薦商品。

許多複雜或利用先進技術的推薦系統,背後原理依然與此2原則脫不了關係。Nitzan Mekel-Bobrav舉例,透過深度學習技術,AI模型可以從非常多維度來分析商品,將這些維度轉換為嵌入向量(Embedding Vector),再利用K-近鄰演算法(KNN,K-nearest Neibourgh)等方法,從向量空間中找出最接近的商品。這種做法仍屬於內容過濾法精神。

另一個例子是,有些號稱以顧客興趣為中心的AI模型,會比較一系列的商品點擊紀錄,甚至進而預測下一個商品點擊行為。不過,「這仍是從商品相似性為出發點,還把一個活生生的人化約成區區幾個滑鼠點擊。」Nitzan Mekel-Bobrav吐槽。

相似性推薦法已經不夠有效

多年來,eBay也是從商品相似性出發,來進行個人化推薦。

這種思維帶來的最大限制是,不論技術上如何先進,判斷商品相不相似,都是基於電商對商品的分類方法,以及對相似性的定義。這意味著,就算有一組商品,在顧客認知中具有高度關聯性,只要這些商品各自被歸類到差異很大分類中,系統便無法推薦。

Nitzan Mekel-Bobrav指出:「這限制了商品探索階段的可能性,打擊了顧客體驗和廣告投報率,進而影響交易量。」

為了嘗試涵蓋更多顧客角度,eBay會賦予1種商品多種分類。以Jordan 1運動鞋為例,他們將這個商品分類在「服飾/男性/足類商品」、「服飾/男性/運動類商品」、「收藏品/服飾/足類商品」等,共12種分類下。不過,不論電商如何分類商品,顧客眼中都可能有更多種截然不同的分類方法。這對於有1.35億名活躍會員、17億項商品的eBay來說,尤其如此。

相似性推薦法另一個明顯短版是,利用KNN、ANN(大約近鄰演算法,Approximate Nearest Neighbour)等找出向量最接近商品的方法來做推薦,有可能因為同性質的商品數量過多,而使推薦內容枯燥無味,甚至全是不同賣家上架的相同商品。

他以自家電商頁面為例,eBay商品頁面會有類似商品版位及交叉銷售版位,前者是用來呈現同款不同價位商品及類似款項商品,後者則是用於顧客商品探索,主要呈現互補品或其他關聯商品。延續Jordan 1鞋子的案例,進入商品頁面,這2種推薦商品版位,呈現出來的商品全都是同款鞋子。這是因為,eBay站上有太多人在賣同款鞋,即使交叉銷售版位會檢索嵌入向量鄰近度稍微遠一點的商品,還是只會找到同款鞋。

這種現象,等於使eBay失去了讓顧客探索更多不同商品,促成更多訂單的機會。不只如此,顧客還可能因為購物體驗乏味,而直接離開網站,甚至減少未來造訪頻率。

漸進迭代式的改造推薦系統,先固本再革新

Nitzan Mekel-Bobrav認為,推薦系統最關鍵的課題就是,有效尋找高關聯性(Relevance)商品,引起顧客購買興趣。他強調,商品關聯性由顧客定義,而非平臺。這正是為什麼,eBay必須打破實行二十幾年的商品相似性推薦思維,採用一種新推薦方法,讓具有不同角度及背景的顧客,都能找到在他們眼中具關聯性的商品。

商品相似性推薦法將商品相似性與關聯性畫上等號。過往,eBay會制定一套理解商品的分類框架,再將顧客行為化簡為靜態的商品特徵數據,來匹配鄰近分類商品。這種做法聚焦商品數據,顧客數據顆粒度通常較為粗糙。

2021年起,eBay的推薦系統核心思維,開始採取不一樣的新做法,改從顧客行為出發,猜測顧客眼中的商品關聯性──不只根據相似性,也可能包括互補性、替代性,或其他關係。他們用接近即時的方法跟隨顧客旅途,蒐集顧客行為時序,不斷猜測顧客興趣,再根據興趣推論顧客如何連結起商品。

從平臺單一角度出發,分析單一種關聯性因素,轉變成從上億個顧客角度出發,分析多種關聯性因素,需要處理更大量、更細緻的顧客及商品數據,難度較商品相似推薦方法高不少。

不過,對eBay來說,要多增加一個數據維度來支援推薦系統,都是一件龐大且艱難的工程。因為,他們的商品高達17億項,而且類型多元,許多商品是非規格商品,甚至是不會重複上架的一次性販售商品。許多常見的數據處理方法,難以規模化來套用到eBay這種量級和複雜度。例如,對每一件商品紀錄上千維度的元數據,再計算出這些元數據間的種種關聯,以eBay規模來說是一件成本極高的事情。

eBay建設推薦機制的超高難度,使他們轉移推薦典範時並非一蹴而就,而是從強化既有推薦做法開始,先訓練出自己的語言模型,來處理商品文字資訊,再加入了更多維度及模態的商品數據,作為推薦依據。他們還得想辦法優化龐大模型的運算量,來縮短推薦系統的計算延遲,並處理更多更複雜的數據。

對商品數據累積足夠的理解後,他們開始擴大蒐集及分析更多種類、更細緻的顧客行為,要從顧客角度,描繪出專屬每一個人的商品關聯性框架。

 系列報導 1  為何eBay要推翻用了25年的傳統推薦?

 系列報導 2  超級個人化推薦是eBay下一步目標

熱門新聞

Advertisement