圖片來源: 

李建興攝影

一群清大生創辦的Gogolook(公司中文名為「走著瞧」)因其行動裝置上的來電辨識App Whoscall而富盛名,在2013年更被LINE的母公司Naver以高達6億臺幣收購這個不到10人的公司,Gogolook執行長郭建甫及資料科學家高義銘在2014年臺灣資料科學愛好者年會的第2天,介紹他們如何將資料科學應用在公司產品甚至是策略上,並使其轉化為價值。

郭建甫表示資料科學的概念深深滲透Gogolook的每個部門及環節,早在創辦初期就有這樣的想法了,剛開始在做創業發想,就一次丟了5支App到市場上,藉由分析市場反應而決定公司產品走向。甚至最近Gogolook在香港投放行動廣告,也是一次製作了很多個版本,藉由使用者點擊後的資料回饋來了解使用者的喜好進而修正策略。

Whoscall 2013年在全球8個國家被Google評為最佳Android App,郭建甫分享創新的秘訣,他表示競爭者很容易學走創新的點子,但是當公司的價值奠基於創新後累積的資料或是經驗,競爭者就難以模仿。郭建甫爆料,當初Whoscall服務剛建立,使用者基礎還不夠龐大,服務中的電話黑名單還是人工蒐集網路資料來的。

郭建甫說,市面上其實也很多人在做來電辨識,但為什麼是Gogolook被收購,還被評為最佳App,就是因為在Whoscall在到達一定使用者基礎後,開始將使用者回饋的資料結合機器學習,強化Whoscall來電辨識的能力,所以即使競爭者可以在初期學走來電辨識的點子,但是到達用資料科學的方式辨識來電的程度,技術門檻已經難以被模仿。

Gogolook科學家高義銘用Whoscall其中一個功能,舉例說明資料科學在來電辨識的應用。過去使用者接到一通未知來電,如果想要知道電話是誰打來的,可能的做法是查電話黃頁或是Google,那如果使用者想知道這通未知來電,是否有可能是推銷電話,或是騷擾電話甚至是詐騙電話呢(統稱這些為垃圾電話)?當Whoscall能預測出來的話,就能先警告使用者了。

Whoscall希望能以群眾經驗做到即時告知使用者未知的電話是否為垃圾電話。

首先,他們找了一群願意提供測試資料的使用者,分析這些使用者的通話紀錄,發現很明顯的現象,如果是垃圾(Spam)電話,該電話號碼撥出次數一定比接聽多。高義銘說,撥出率高這是一項垃圾電話的特徵,他們總共定義了64項特徵以辨識垃圾電話。但高義銘表示,不可能為特徵訂定固定的門檻值,把超過門檻值的當作是垃圾電話,因為特徵總共有64項,而且門檻值可能會跟著各種情況變動,因此這也衍伸出另一個問題,多少的門檻值是合適的。

所以高義銘說,科學的方法就是使用機器學習,不過思路到這必須回歸使用者的真實使用情境,真是的情境是當有一通未知電話撥進使用者的手機,Whoscall必須立即告知使用者這通電話是否為垃圾電話。

簡單來說,篩選方式是對來電進行SVM二元分類法,用定義的64個特徵當作篩選條件,來判斷電話是否為垃圾電話,越先使用的特徵權重越大,每支電話都會經過一連串是與否的判斷。不過,後來發現因為完整的經過64個特徵篩選結果雖然會比較精確,但是太過耗時,因此最後只留下20個影響較大的特徵,雖然稍微影響判斷精確度,但是這是效能與精確度權衡的結果。

垃圾電話特徵之一:垃圾電話的通話時間會小於正常電話

垃圾電話特徵之二:垃圾電話接聽率小於正常電話

垃圾電話特徵之三:垃圾電話號碼通常不在使用者電話簿當中

除了可以分辨來電是否為垃圾電話,Whoscall還能知道來電是不是只響一聲就掛斷,以引誘接聽者回撥,藉以收取高額電話費的惡意來電。高義銘說這類型的電話特徵很明顯,就是接聽率很低,因為都只響一聲就掛斷,另外也跟垃圾電話一樣,經常撥出許多新的號碼但較少的電話撥入。

在觀察判斷的精確度除了需要看判斷正確的例子,還需要觀察判斷錯誤的次數,才能客觀衡量準確度,而Whoscall的平均精確度達到95%。

郭建甫表示,Whoscall的影響力已經大到嚴重影響銀行跟保險業的行銷電話接聽率了,而這也將促使這類型的電話行銷服務轉型改變。


Advertisement

更多 iThome相關內容