偶像生成AI打造獨一無二電玩角色

臉譜出版

位於京都的新創公司DataGrid，持續研發將創意人的工作交給人工智慧的「創意人工智慧」。該公司提出未來全新的人工智慧運用方式，研發出能「生成」偶像臉孔的人工智慧，作為一項「創意人工智慧」。

DataGrid社長岡田侑貴說明，「講到以往的人工智慧，幾乎都用來辨識、預測，很少看到創作的人工智慧。DataGrid希望藉由讓人工智慧做創意人的工作，刺激創意人的想像力，打造一個人類與人工智慧共同創作的社會。公司裡的十一名員工全都具備機器學習的專業背景，在學術上也與大學展開共同研究。另外，商業面上用創意人工智慧的成果，建立起能夠授權企業的商業模式。」

以深度學習來辨識偶像的特徵

DataGrid打造能自動生成偶像臉孔的創意型人工智慧應用。

二○一八年六月，該公司宣布研發創意人工智慧的應用軟體「偶像自動生成AI」。這項作業的概要，是讓運用深度學習的人工智慧以幾萬張偶像大頭照來學習，使人工智慧辨識出偶像的特徵。藉由學習了偶像臉孔特徵的人工智慧，來生成虛擬的偶像臉孔。因為有無限多變化，可以創造出擁有「偶像臉孔特徵」的人臉。

在具體的手法上，使用的是「生成對抗網路」（Generative Adversarial Network，GAN）。生成對抗網路是一種非監督式學習模型，從不給予正確答案的學習資料中，推導出結構和規則，並「生成」影像等成果。其中一個網路是試圖接近從給予的學習資料所獲得的資訊，另一個是判別真偽的網路，藉由兩者在互相對抗之下各自提高準確率，提高要求的影像等生成物的品質，因此以「對抗」為名。

岡田建立使用生成對抗網路的人工智慧模型，成功將偶像臉孔特徵做出頸部以上的高解析度（1024×1024）影像，但研發過程中面臨意想不到的狀況。「一開始使用偶像臉孔的影像來學習時，雖說看得出是臉部，但生成的大多是輪廓不完整的怪臉孔。其中一個原因是起初的資料量比較少，大概只有五千筆。另一方面，偶像的大頭照形形色色，有些影像中配戴了髮飾，或者比出勝利手勢，還有臉轉向側面的，因此有時頭髮上出現莫名其妙的圖案。最後增加了幾萬筆學習資料，在資料上有絕對的優勢，不過我深深體會到針對資料進行預處理，修正為適合學習的型態，這一點非常重要。」（岡田）

有了資料的預處理，加上自由度高的學習模型最佳化，並且有後處理（posttreatment）的機制，評估生成的影像，只留下好的顯示為成果。費盡心思，終於完成了偶像自動生成AI。

經過一番努力研發出的偶像自動生成AI，現階段還沒有明確的用途。岡田說明，不只是目前的「臉孔」，希望能用人工智慧來生成動態的虛擬偶像「全身」。這麼一來，在很多情境下都能以虛擬偶像來替代真人上場。「出現在電視廣告中的人物或電商服飾模特兒，未必一定得是真人。如果能用人工智慧模特兒來替代真人藝人，想降低成本的廣告或電商網站就能使用虛擬人物。」（岡田）即使因為成本而無法採用真人，生成高解析度且幾近真實的人物影像，同樣帶來新的創意。

生成「擬真影像」的技術有什麼用處？

使用生成對抗網路生成新資料的人工智慧，可說是DataGrid的核心技術。換言之，DataGrid的業務不只是偶像自動生成。

另一個接近偶像自動生成的領域是「內容（contents）自動生成」。運用生成對抗網路，以動畫人物或電玩遊戲中使用的地下迷宮（dungeon）作為學習資料建立模型，生成前所未有的「具備動畫人物特徵的影像」或「具備電玩遊戲地下迷宮特徵的圖形」。如果有效運用這類人工智慧，就不必像現在人工作業繪製一個個動畫人物，只要用生成對抗網路一次生成多個人物，然後「挑選」出來。

比方說，使用能生成無數個人物的特徵，在電玩遊戲中針對每個玩家有不同的客製化人物。事實上，經營線上電玩遊戲的Aeria便投資了DataGrid，共同推動以人工智慧生成人物影像的專案。目前除了規畫提供利用這項技術的電玩遊戲，未來還預計發展出讓人工智慧辨識玩家喜好並配合生成遊戲人物。

不只生成影像，還能應用於加工。「把照片變成梵谷名畫」之類廣受歡迎的手機應用程式，很容易建立影像濾鏡功能，根據某些特徵來改變圖像。除此之外，要提高畫質粗劣的影像的解析度，「超解析」（super-resolution）、「降噪」之類影像處理也能有效使用生成對抗網路，目前仍持續研究開發。超解析必須生成原本非以數據存在的畫素資訊，但這種「擬真創作補足」正是生成對抗網路最擅長的領域，「成功實現了比以往超解析更漂亮的超解析影像。」（岡田）降噪方面的成果同樣效果顯著，未來可望應用在影像和照片的數位修復作業或博物館。

第三個解決方案是「學習用資料的自動生成」。想在業務上運用人工智慧，想用深度學習打造模型，雖然有這樣的期望，卻礙於收集不到學習用的資料或數量太少，這些情況尋常可見。例如偵測異常的人工智慧，即使有大量正常的影像，通常顯示異常的影像很少。這時可以運用生成對抗網路，生成各種「具備異常特徵的影像」，以這種方式來增加學習用的資料。

「如果能把一百筆資料增加到一萬筆的各種變化，深度學習的準確率大幅提高。工廠內的異常影像、產品品管檢查時發現缺失的影像、行車紀錄器拍到汽車前方有人或動物衝出來的影像等，這些希望借助運用人工智慧的異常影像數量都很少。若以生成對抗網路生成的資料來補充，將有助於建立準確率高的人工智慧模型。」（岡田）

藉由DataGrid研發的人工智慧，能夠以各種形式「無中生有」。DataGrid和面對課題的夥伴企業共同運用這些功能。岡田表示，「到頭來，人工智慧單打獨鬥什麼事都做不了，重要的是『人工智慧×未知的X』。然而，要靠自己來打造X，工程太浩大。因此，我們希望與已經擁有X的其他公司合作，繼續推動創意人工智慧的實用化。」他非常看好創意人工智慧的未來。（摘錄整理自本書case 31）

書名 深度學習的商戰必修課：走在時代尖端的日本企業如何活用AI

日經xTREND／著；日本深度學習協會／監修；葉韋利／譯

臉譜出版

售價：420元

作者簡介

日經xTREND

新興市場創業人的數位策略媒體。針對正在開發企業新業務、致力行銷相關業務者，提供行銷、消費、技術、資料、創新等領域的最新相關實務資訊。

熱門新聞