全球最大的民宿訂房平臺Airbnb,如何成為全球背包客的最愛,Airbnb首席經濟學家暨資料科學團隊主管Peter Coles於12日在臺揭露了這個關鍵,Peter Coles指出,住房體驗是影響房客回訪率的主因之一,而房東則是決定民宿品質的關鍵,房客只要遇到好房東,就能吸引用戶持續回來使用Airbnb平臺租房,但Airbnb全球擁有超過400萬間民宿,如何自動且快速判斷出每一間民宿的房東評價,就成為Airbnb的挑戰。Airbnb從PB級的用戶資料中,用自然語言分析房客每一則評論,建立了一套評價房東品質的機制。

Airbnb在2008年創立,經過短短的兩年,Airbnb開始意識到資料科學的重要性,在2010年成立資料科學團隊,而目前資料科學團隊已經具有超過百位的規模,甚至,為了在Airbnb企業內部建立以資料驅動決策的環境,去年成立了資料大學(Data University),鼓勵內部「每位」員工參加資料分析課程,資料分析課程的認證機制相當特別,員工完成課程後則可得到一張貼紙,貼在自己的電腦上,就能夠讓大家知道自己已經完成課程,並取得認證。

如何提升留客率?從分析房東和房客行為特徵資料挖掘關鍵

「用戶持續回訪能為Airbnb帶來更多收益,」Airbnb首席經濟學家暨資料科學團隊主管Peter Coles表示,對Airbnb而言,留住用戶是主要增加獲利的方式,Airbnb的角色就是要媒合房東和房客,因此,如何改進平臺上的用戶體驗,就變得相當重要。

Airbnb的訂房服務散布於全球,超過191個國家、6.5萬個城市,提供超過400萬個房間的訂房住宿服務,截至目前為止,Airbnb已經擁有PB級的資料量,且資料分析模型也相當複雜,需要交叉分析多個不同資料集,不能只單靠傳統的分析方法,因此,Airbnb也加入機器學習技術來分析海量且複雜的資料。

Airbnb資料分析可分為3個面向:房東、房客和社群,從房東的面相來看,Airbnb分析了房東提供的住宿品質、房東如何藉由短期出租負擔房貸、房東的創業型態和房東行為與一般假設是否相符合等問題。

Peter Coles舉例,Airbnb分析房東行為與一般假設是否相符合的問題,根據美國一家市調機構皮尤研究中心的研究指出,擁有較高收入的年輕男性,有較高的傾向採用新科技,而「Airbnb上的房東(旅宿創業家)特徵卻完全相反!」,Peter Coles興奮地說,Airbnb的房東超過55%是女性,就連在臺灣也有53%的房東是女性。

而房東提供住宿的品質,是Airbnb必須把關的重要關鍵,擁有高品質的房東,才能吸引更多新的用戶到平臺上訂房,也能留住既有的用戶持續使用平臺服務,不過,如何有效且準確地量化房東的品質,不是一個簡單的問題,因此,Airbnb與芝加哥大學合作,研究如何將品質量化,精準了解每位房東的品質,進而調整平臺上推薦的策略,為平臺帶來更多收益。

Airbnb平臺上有最常見的評分系統,透過房客給予房東星等的機制來得知房東品質,不過,「星等的評分機制很難真正量化品質!」Peter Coles指出,每個人對星等的評價也沒有相同的標準,導致評分結果相對主觀,不容易看出每個星等對應品質的真實意義,因此,Airbnb透過自然語言技術,擷取房客留下的評論資訊,將房客的評論加入評估的特徵,建立出顧客回訪傾向(Guest Return Propensity)分析模型,評估可能影響顧客回訪的因素,在媒合房東與房客時,達到最大化使用現有資源的目的。

Peter Coles表示,擁有房東品質的分析資料,可以優化推薦房間的排序,進而提升用戶體驗,舉例來說,新加入Airbnb平臺的用戶,第一次使用訂房的經驗,將會對日後是否回訪產生很大的影響,因此,Airbnb就能將品質較好的房東推薦給新用戶,確保新用戶第一次的使用者體驗是良好的。

另外,從旅客的層面來看,Airbnb也藉由平臺收集的資料,分析旅客的旅遊模式(Travel Pattern),更了解用戶來提供更貼近用戶需求的服務,Peter Coles舉例,Airbnb今年在搜尋條件的旅客欄位上,加入小孩和嬰兒的選項,為的就是要收集更細化的資料,以了解不同組成的旅客,會有哪些不同的旅宿行為特徵。

臺灣短期出租市場有什麼不一樣的特色?

根據Airbnb分析臺灣地區去年在平臺上的資料顯示,臺灣在Airbnb平臺上的活躍房東數有超過8,000位,每年每位房東平均收入為12萬7千元,房東的平均年齡為38歲,而房客是29歲,一位房客平均停留2.4個天,Peter Coles指出,臺灣的分析結果與其他國家比較不同的是,房客平均停留的天數較短,他推測,這可能與臺灣的旅遊型態不同有關。

Airbnb資料科學的挑戰

Peter Coles表示,Airbnb擁有相當大且複雜的資料量,光是房間數就有400萬筆,訂房數量的資料則是以億級來計算,而使用者在平臺上搜尋的行為資料量更達到10億的規模,更不用說搜尋的過程中,用戶設定不同的條件參數又更為複雜,「我們的資料複雜度是非常驚人的!」Peter Coles表示,從這些資料中要找出有意義的分析方法和結果,是非常困難的。

不過,Peter Coles認為,即使建立資料分析模型相當困難,需要交叉分析多個不同資料集,但是對他而言,更大的挑戰是,「確保資料分析的結果能夠轉化為真正可用的策略,」進而採取行動,為企業創造真正的價值,他指出,多數資料科學家比較少有機會與用戶和內部其他部門的人溝通,要讓分析結果與採取策略行動的人產生互動,是目前資料科學團隊比較大的挑戰。

在眾多資料分析的計畫中,其中,令Peter Coles自己最感興趣的資料集,竟然是Airbnb內部人資的資料,他表示,這些資料能夠展示不同的人才在企業內發展的途徑,也能夠找到一些有趣的規則,像是具備哪些特質的員工會是一個好的經理人,或是哪些人具有幫助同事成長的特質等。

另外,Peter Coles未來還想進一步分析Airbnb的房東與房貸之間的關聯,他想更進一步了解房東如何透過Airbnb出租房間來解決房貸遲繳的問題,像是什麼樣的人和什麼樣的出租型式能夠解決房貸問題,每個不同的特徵之間又有什麼樣的關聯等。


Advertisement

更多 iThome相關內容