LINE在近期臺灣技術日活動正式推出支援中文的Chatbot開發工具Clova Chatbot Builder,主打自動化機器學習AutoML特色,免寫程式,只需上傳對話資料,也不用人工貼標,就能主動優化Chatbot的對話能力。Clova Chatbot Builder已經可以支援正體中文,目前採用韓文語料翻譯成中文後,來打造出中文的NLP引擎,只有50個意圖時,辨識率可以達到9成,還需要更多臺灣語料來進行優化。(攝影/洪政偉)

這個LINE年底在臺灣的重大宣布,將會是明年在臺最重要的一步新戰略:LINE商用AI要落地臺灣了。在剛落幕的 LINE臺灣開發者大會上,LINE臺灣董事總經理陳立人一上場就宣布了這個計畫。明年先應用到LINE自身業務,來改善用戶體驗,到了明年下半年,再進一步挑選先行試用的企業。

外部SI或加值應用代理商,甚至,未來,他表示,LINE Brain上的各種技術,都引進臺灣商用環境,提供給臺灣消費者、中小企業和各大品牌業者,這也是他想要靠AI搶攻的三大類族群。

LINE技術長朴懿彬最近在東京開發者大會上,公開了自家AI藍圖,也揭露了主要研發的8大領域,包括了自然語言處理、語音辨識、電腦視覺、OCR、臉部識別、影音處理、資料分析、語音合成。LINE Brain就是利用這些技術或旗下的衍生技術,所發展出來的AI產品線,目前已發表的產品有Chatbot技術、OCR文字辨識和語音辨識技術(Speech to Text),未來還將推出語音生成(Text to Speech)和影像辨識。

LINE日本總部,早在2017年就對內揭露了日後發展AI的新戰略,開始提供大量線上課程,來培養內部人員。LINE臺灣也是在2年前,開始投入機器學習領域的培訓。LINE臺灣資深技術總監陳鴻嘉先從內部成員中,找到種子成員,從論文研究、資料蒐集、系統規畫到設計開發,先開發了一套機器學習訓練系統,再打造出LINE客服小幫手Chatbot,從此,LINE臺灣客服部門的官方帳號,可以開始回應用戶的提問。

LINE在臺灣開發日活動上宣布LINE Brain明年登臺,LINE臺灣資深技術總監陳鴻嘉也揭露了優先導入的三大AI技術,包括了語音辨識、語音生成和臉部辨識,另外也會優先引進Clova Chatbot建置工具。

後來,LINE的Clova AI團隊看到臺灣工程部門自己打造的整套機器學習系統,就將總部的AI技術提供給臺灣使用,同時,臺灣團隊也開始參與總部中文NLP和NLU分析模型的強化。隨著,臺灣在地資料越來越多,LINE總部資料管理跟處理團隊也來協助,在今年設立了臺灣的資料工程團隊,成員包括了資料工程師、資料科學家、資料分析師和自然語言處理工程師。

LINE訊息查證,就是這個團隊自主開發的第一個AI應用。過去,這類用戶檢舉,得靠人工審查,但是同樣的訊息可能散播給2百萬人,其中10萬人通報檢舉,利用文字辨識、圖片內容OCR,來判斷是不是同一則訊息,就不用人工重複審查這則訊息的10萬次通報。

不只這個查證應用,在LINE總部揭露的AI藍圖8大方向中,陳鴻嘉指出,已有不少已經落實到在臺推出的服務中,LINE客服後臺的檢舉處理上,就是運用了圖像辨識、文字辨識來輔助檢舉訊息的判斷,就算是圖中有文字也可以分辨,來判斷是否為需要過濾的不當內容,用來改善內部的工作效率。另外,像LINE貼圖小舖,也同樣利用OCR來辨識貼圖中的文字,自動產生推薦用的標籤,這項專案,LINE臺灣的臺灣工程團隊也有跨海參與。或像是文字辨識服務,用LINE拍照後,可以辨識出圖中的文字,來進行翻譯或分享給好友。

今年先推的服務LINE Music中的AI DJ功能,可以透過聲紋比對出音樂類型,再由機器人自動播放風格相似的音樂給使用者。或像LINE購物的商品推薦技術,就直接使用了日本總部的資料叢集、搜尋引擎、推薦服務技術,來開發臺灣本地端的LINE購物產品推薦機制。原本日本總部的推薦引擎,對中文內容的推薦品質較差,後來,臺灣工程團隊協助強化了中文斷詞等NLP技術,才能順利推出更適合臺灣用戶習慣的推薦內容。

LINE臺灣工程團隊早就開始運用總部的AI技術,例如LINE購物就使用了搜尋引擎技術、推薦服務等。經過這些練手,這個團隊將成為日後LINE Brain在臺技術支援。

最近,LINE臺灣剛舉辦了第一次內部的AI黑客松競賽,奪下第一名的是自動報帳系統,臺灣一位工程師,運用總部OCR技術,自動辨識手機拍下的紙本單據照片上的所有文字,透過機器學習判斷出哪些是申請表單需要的資料,再自動帶入對應的欄位,原本需要30分鐘填寫的報帳作業,現在只需要幾分鐘就能完成,後來,這套比賽成果,還變成了他們的內部正式系統。

臺灣工程團隊將成LINE Brain在臺技術支援

透過這些專案的磨練,LINE臺灣工程團隊可以成為LINE Brain引進臺灣的關鍵技術人力,他們最新的任務是,開始跟日本LINE Brain團隊合作,日本LINE總部的NLP技術已經支援日文、韓文,目前在資料分析與學習平臺,Clova Chatbot Builder都已經支援中文,但還需要持續調校,這正是臺灣工程團隊的任務之一,另外,他們也要負責解決臺灣開發者遇到的問題。

LINE臺灣團隊,在過去四年成長了10倍,其中有一成是資料工程團隊,但是,陳鴻嘉坦言,還是需要更多資料工程和資料科學的人才。

他解釋,這兩種角色的分工,用戶資料從前端蒐集後,還得經過清洗、驗證品質等資料工程處理,才會提供給資料分析科學家和資料分析人員使用,進行假設驗證、建立ML模型、資料實驗等。資料分析人員偏重負責商業分析、使用者需求、使用者傾向,以及找出哪些地區的用戶對何種產品有興趣,來幫助商業上的決策。而資料科學家則要負責機器學習建模。最後找到可用的ML模型後,要轉為對外服務的API,同樣再由資料工程師來負責建置。為了LINE Brain落地臺灣後的技術團隊支援,也展開新一波的徵才。

Chatbot建置工具、語音辨識與合成、臉部識別先落地

陳鴻嘉已經預告了LINE Brian將先導入臺灣的技術,Chatbot Builder將是第一個引進,也會將原本臺灣團隊自行開發的客服小幫手,改用這個工具重新訓練。另外,也會先將語音合成(Text-To-Speech,TTS)、語音辨識(Voice)和臉部辨識技術引進臺灣,讓客服小幫手可以用語音來回答用戶。

而LINE Bank籌備處執行長黃以孟日前在臺北金融科技展時也透露,將會採用NLU技術來介接銀行業務,以打造智能客服,或是運用eKYC技術來優化客戶申辦流程,儘管他沒有直言會採用LINE Brain產品,但這兩項技術,LINE Brain都正是推出了商品化的產品。

明年如何挑選第一波試行LINE Brain的合作對象?陳鴻嘉透露,希望以日常生活中的服務優先,可以涵蓋食、衣、住、行類的需求,評選重點是能不能用AI讓生活變得更方便;另外,也開放Clova Chatbot Builder工具在臺灣試用的申請。

 相關報導  LINE全面進攻AI


Advertisement

更多 iThome相關內容