LINE首度揭露自家AI藍圖,主要聚焦8大類AI領域:自然語言處理(NLU)、語音辨識(Speech)、電腦視覺(Vision)、OCR、臉部識別(Face)、影音處理(Video)、資料分析(Data),以及語音合成(Voice)。從這八大類再延伸一層就是該類的主要AI技術(綠色字)。圖片來源/LINE

「現在,LINE已經是一家AI公司。」今年6月,LINE共同執行長慎重熩(Jungho Shin)在年度大會中,揭露了LINE下一階段發展的新定位。LINE不只是一家大量使用AI技術的公司,更開始要轉型成銷售AI,甚至未來要靠AI產品獲利的公司。甚至在11月中,日本雅虎與日本LINE正式宣布經營權整併計畫的記者會上,Line社長出澤剛更訂出了新的戰略目標,未來要成為日本,甚至是亞洲領先的AI公司。

但是,LINE要如何實現這個目標?單從6月年度大會中,令人驚艷的AI餐廳訂位服務DEUT實際展示,或是7月開始上路銷售的商用AI計畫LINE Brain描述,還不足以證明LINE的AI實力,直到11月20日的LINE開發者大會,終於揭露了更詳細的AI戰略藍圖,甚至是各項LINE自家AI技術、相關產品、內部應用的AI火力大展示,連這次開發者大會3千人的報到過程,也採用了LINE Brain自家的臉部辨識服務,來進行報到入場。

不同於去年主打區塊鏈架構和代幣經濟,朴懿彬強調,LINE的新發展策略是「LIFE with LINE」,要讓使用者生活與LINE平臺有更多連結,包括了金融科技、商務、O2O生活、內容與娛樂領域,都可以提供更便利的數位生活,也希望利用AI,讓他們所提供的服務形式更自然、更人性化。

例如在與生活息息相關的金融服務上,LINE已有多項成果,包括保險服務上路半年就取得17萬張保單,LINE Score達成百萬用戶註冊只用了19天、家計簿服務用戶數在9月時超過了4百萬人。金融服務類型也正式新增了證券服務、電子錢包和加密貨幣交易所。LINE Pay日本用戶規模更達到了3,700萬人,若加上了臺灣、韓國、中國、泰國等市場,全球用戶合計是5千萬人,全球交易總額已經超過1兆日圓。LINE全球每月活躍用戶數,在今年11月時也達到了1.85億人。

從即時通訊軟體、內容平臺到App生態系

LINE從2011年問世,前幾年以擴大市場、支援平臺、搶攻用戶為主要發展目標,2016年開始轉而聚焦內容服務,以智慧入口(Smart Portal)為新的戰略目標,也開始開放自家平臺,陸續釋出API供外部服務串連,先從LINE Login機制開始,後續如Messaging API、LINE Beacon、Rich menu API、Flex Message、Quick Reply、LINE Things等,2018年甚至開始推出通用型的開發框架工具,例如2018年6月推出第一版的LIFF(LINE Front-end Framework)、遊戲開發框架Quick Game、物聯網開發框架LINE Things,而今年10月,LIFF也升級為第二版。

為了與生活場景有更多連結,朴懿彬表示,今年進一步推出了LINE MINI App應用程式發布平臺。這個發布平臺,讓LINE不只是第三方服務串連的集散地,更成為了部署和執行各種第三方平臺的新App生態圈。

原先用LINE API開發的服務,現在都可以直接整合到LINE上,用戶也可以透過搜尋找到這些第三方提供的App服務,還新增了免費官方帳號系統通知功能,舉凡出貨通知、到貨通知等,現在都可以直接推播到與使用者溝通的官方帳號中。

2017年開始全力布局AI

這些與生活息息相關的服務和功能,都需要大量的AI相關技術來優化。擁有龐大用戶和資料量的LINE,很早就開始擁抱大數據技術和機器學習技術,例如在搜尋、推薦、廣告等。到了發展智慧入口網站,更是大力擁抱各種AI技術,來改善自家的服務或產品。

2017年3月,LINE從內容平臺,正式跨入了AI市場,和母公司Naver聯手開發,在MWC大會上發表了自家第一款雲端AI平臺Clova,名稱取自Cloud Virtual Assistant的縮寫組合,意指LINE從智慧助理技術和產品切入火紅的市場競爭,當年隨後也推出了智慧喇叭,頗受好評,但受限於支援語言初期先以日語、韓語為主,遲遲難以推向海外市場。但,這只是LINE日後新AI布局的藍圖一角。

不只是新AI平臺產品的登場,LINE更在內部,大力揭露未來的戰略方向就是AI,提供大量線上課程,來培養內部人力的AI能力。例如,LINE臺灣工程團隊也是因此開始接觸AI技術,找來種子成員,自行摸索、建置、設計了第一套AI聊天機器人的應用來練兵。2018年4月更設立了LINE研究實驗室,專供未來科技的基礎研究,最初的研究主題都環繞在AI處理相關的領域上。

在2018年LINE開發者大會上,儘管最亮眼的主題是區塊鏈和代幣經濟,但LINE其實也揭露了自家AI布局的初步成果,並將原本聚焦語音助理的Clova品牌,擴大成為了一個泛AI技術產品線,正式發表了OCR、NLU的成果。

在去年開發者大會上,LINE還推出了一個AI技術示範網站,也透露出所聚焦的AI研發方向,包括如開車語音控制用的語音識別技術、智慧喇叭對話的語音生成技術、用於商品圖像搜尋的電腦視覺技術、自動特寫影片人物的影片自動剪輯能力、OCR文字識別、雲端機器學習平臺NSML、即時串流影片中的人臉偵測技術等,另外,不用寫程式的Clova Chatbot Builder開發工具也首次公開畫面,一亮相,現場開發者響起熱烈的掌聲。不過,去年只開發少數合作對象,或共同研發的企業試用,這些AI技術仍舊沒有商品化。

直到今年,LINE在今年6月的年度大會上,一舉宣布了商用AI計畫LINE Brain,將自家AI技術變成了企業商用產品,開始進軍企業AI的B2B市場,甚至發表了一個代表性產品,AI餐廳訂位專案DUET,可以讓AI代替真人,來負責接聽餐廳的訂位電話。從這時候起,LINE開始對外以AI公司來介紹自己。LINE Brain從7月開始,初期先推出像是如Chatbot、OCR和語音識別STT,未來還計畫推出語音合成TTS、影像識別等服務。

LINE Brain部門主管Shinichiro Isago也在今年開發者大會上宣布,DUET成為正式產品,也改名為LINE AiCall服務,LINE和日本知名餐廳預約系統ebica合作,在原有電話訂位系統(IVR),串接了AiCall,來接聽預約電話。

東京已有家牛排館「俺のGrill&Bakery 大手町店」,展開AI電話訂位服務的實測,第一波開放預約的實驗為期約一周。Shinichiro Isago還打趣說,可以打電話去試試看,但要記得去吃,因為這是真實的AI訂位服務。目前AiCall也只支援日語。

AI語音訂位專案DUET成為正式產品,改名為AiCall服務,LINE也和日本知名餐廳預約系統ebica合作,在原有電話訂位系統(IVR),串接了AiCall,來接聽預約電話。東京有家牛排館「俺のGrill&Bakery 大手町店」,在11月底展開了為期一周多的AI電話訂位服務實測。圖片來源/LINE

臺灣LINE也有近30位開發工程師到東京開發者大會向四國開發者分享,涵蓋AI、UI/UX、專案管理、資料及API應用的開發成果,例如攤位展示中,有位臺灣LINE工程師就展示了用於LINE購物的商品推薦技術架構,如何運用LINE的資料叢集、搜尋引擎、推薦服務,再結合臺灣LINE購物開發的機制來對臺灣用戶提供產品推薦,在場解說的臺灣工程師解釋,原本總部的推薦引擎,對中文內容的推薦品質較差,後來,由臺灣團隊協助強化了中文斷詞等中文NLP技術,才能順利在臺灣LINE購物中,推出更適合臺灣用戶習慣的推薦內容。

首度揭露AI未來藍圖,聚焦8大類領域

不只開始大秀AI產品化成果,朴懿彬也首度用一張AI藍圖,清楚地描述出LINE的AI產品和技術最新發展。這是第一次,LINE清楚地展示出自家AI發展架構的全貌。

朴懿彬沒有進一步解釋細節,但從這張藍圖,可以看到LINE主要聚焦8大類AI領域:自然語言處理(NLU)、語音辨識(Speech)、電腦視覺(Vision)、OCR、臉部識別(Face)、影音處理(Video)、資料分析(Data)、語音合成(Voice)。

從這八大類再延伸一層就是該類主要的AI技術(綠色字)。例如口說下面,包括了讀唇語技術(Lip Reading)、謄稿技術(Transcription)和電話網路語音辨識。或像視覺AI(Vision)涵蓋了食物影像辨識、產品影像辨識、唇語辨識、時尚影像辨識(Fashion Image)、特色分群技術(Spot Clustering)等。

例如在OCR下已有多項綠色字的AI技術,包括了手寫字型生成(Handwritten Font)、收據OCR、信用卡OCR、帳單OCR。

有些技術是單獨使用在LINE自家服務,但也有些技術會組合成一項對外提供的產品。例如相關OCR技術已經用於文件智慧(Document Intelligence)和eKYC(可直接辨識照片中的身分證上的文字)。LINE現場也展示自動生成手寫字型的設備,透過繪圖筆直接把AI生成的手寫日文字,自動畫出來,幾乎跟原始手寫字一樣。

從綠色字再延伸出來的亮白色項目,就是更進一步的AI服務元件,例如時尚影像辨識搭配特色分群技術,就變成了視覺搜尋服務(亮白色的Visual Search),LINE也將這項服務用於LINE的商品查詢(LINE Shopping Lens)、成人影像過濾器(Adult Image Filter)、場景分類(Scene Classification)、廣告影像過濾器(Ad Image Filter)等。

不只可以從AI藍圖看到LINE在AI服務和產品化的架構,也可以看到LINE目前正在發展中,還沒有商品化的新應用技術,包括臉部AI之下有自動剪輯(Auto Cut)和自動攝影(Auto Cam)。Shinichiro Isago進一步以今年新推出的Smart Channel(個人化訊息推播)中所用的推薦機制為例,來解釋LINE如何將大量從用戶蒐集來的資料,變成產品AI功能。

這是Smart Channel推薦機制的開發流程,從使用者蒐集到的原始資料,會經過使用者特徵抽取和內容特徵抽取,將這兩類內容各自轉換成數值的特徵向量,也會進行混淆工程的去識別化處理,才提供給ML演算法訓練之用,來打造出個人化推薦ML引擎,也會運用到其他服務上。圖片來源/LINE

用來打造個人化推薦的資料來源有兩大類,包括了使用者的行為記錄(Logs)和所看的內容。LINE再透過使用者特徵值和內容特徵矩陣,將這兩類內容各自轉換成特徵向量,也會進行混淆工程的去識別化處理,才提供ML演算法訓練之用,來打造出三個與個人化推薦相關的3個ML引擎,包括了推薦引擎、相似度引擎(Lookalike)和人口基礎變項數據預測引擎(Demographic prediction),結合這三者就可以來塑造出個人化推播服務,把AI推薦的內容提供給用戶。同一套ML推薦引擎,也會運用到其他服務,包括了貼圖、新聞、數位漫畫或數位廣告服務上。

資料治理原則:隱私優先、避免資料孤島

為了強化資料治理,避免資料孤島,LINE剛完成了一個統一管理的自助式資料大平臺(Unified Self-Service Data Platform),可以統整內部高達100PB的大數據資料,採取單一帳號,可供跨部門的資料科學家和機器學習工程團隊,有一套共同的資料作業平臺和流程。圖片來源/LINE

為了全力發展AI,朴懿彬也提出了LINE的2大資料治理原則。第一是隱私優先(Privacy First),系統預設就考慮隱私設計,也就是「設計預設隱私」(Privacy-By-Design)原則。第二是徹底避免資料孤島(Data Silo),要避免資料分散帶來的風險。

在上述提到的Smart Channel推薦機制開發流程中,從資料蒐集、特徵向量抽取、機器學習引擎處理到變成服務,其中,特徵向量抽取的目的是,將真實用戶的資料,轉換成數值向量,再提供給資料科學團隊設計和訓練模型之用,對資料工程團隊而言,他們只會看到不同的抽象數字,而非原始的圖片、文字內容,LINE透過這樣的混淆工程,來進行所有用戶資料的去識別化,以避免個資和隱私問題。

LINE臺灣資深技術總監陳鴻嘉也補充,LINE要設計一項產品時,都需要由資安部門和法務部門,進行資訊審查和資安審查,審核各種資料的利用情況,尤其要考量使用者資料的隱私問題。光在產品設計階段,就會進行第一次審查,來確定日後蒐集的資料是否合規,是否可供分析之用。當產品上線後,蒐集到了資料後,要儲存到大數據平臺時,會進行第二關的特徵抽取、混淆工程處理,將原始資料轉換成特徵數值的矩陣資料,來進行去識別化,才開放給資料分析團隊使用。最後,要取出資料時還會再進行第三關的審查和權限控管。就算將模型套用到實際產品上,也是由程式自動將用戶發布的文章套用推建模型,來提供推薦清單,資料工程師同樣不會接觸到實際資料。這就是LINE的「設計預設隱私」原則的實際運用。

未來,LINE Brain發展新服務的模式時,Shinichiro Isago指出,也同樣會從用戶或現有服務蒐集而來的資料,透過同樣的資料工程和隱私處理,結合ML技術和演算法,來設計新的服務與友善的UX,再提供給第三方,如企業使用。

LINE也剛完成了一個統一管理的自助式資料大平臺(Unified Self-Service Data Platform),可以統整內部高達100PB的大數據資料,來支援資料科學和機器學習工程之用。另外,內部私有雲Verda也有翻新,要打造出一個可以提供快速生命週期服務的基礎架構,以便統一管理LINE在全球的4萬臺實體伺服器,滿足每天平均41億則訊息的發送,用戶尖峰流量超過每秒1TB的需求。甚至,LINE基礎架構團隊,開始大力擁抱K8s,來建置雲端原生架構的私有雲,提高自動化維運的效率,另外也開始擁抱微服務架構,就是為了因應承載更多Mini App後的大量運算擴充彈性和高可用需求。

「過去2年,我們招募了大量AI人才來發展AI,現在終於到了可以揭曉成果的時候。」朴懿彬認真的說,唯有發展出頂尖的AI技術,才能挑戰全世界的市場。

 相關報導  LINE全面進攻AI


Advertisement

更多 iThome相關內容