左側模糊的小圖,是人工智慧嘗試繪製臉照的成果

圖片來源: 

Google

Alphabet專門研究AI的子公司DeepMind發表最新研究,他們讓AI程式自己學會用繪圖軟體畫畫,繪畫AI起初只是隨筆亂畫,藉由獎勵回饋機制,模擬鼓勵人類學習的過程,讓程式越畫越好。

在這項研究中,繪畫AI程式配備了繪圖工具,並被證明有能力繪製出數字、符號甚至是人物肖像。而最值得一提的是,AI在學習繪畫的過程,不需要使用人為標記的資料樣本,這是與迄今為止的其他研究最大的不同,電腦不需要人類展示就能學會特定技能,這表示節省了大量的時間。

DeepMind解釋,人類眼睛觀看藝術品,其代表意義不僅僅只是光在視網膜上成像,以人類鑑賞一棟建築物為例,除了欣賞建築物外表,同時也會講究其建築工法。他們認為,透過構建物體的工具來理解這世界的能力,是人類智力的重要表現之一。因此,DeepMind希望創造的系統,也能以這個概念運作,學習人類觀賞畫作的方法,試著理解構成圖畫的筆觸,而不是螢幕上眾多畫素的組成而已。

DeepMind設計了一個能與繪圖工具互動的AI程式,能控制畫筆在數位畫布上塗鴉,並控制筆觸的大小、壓力以及顏色。未經訓練的繪畫AI,只會在畫布上隨意地塗抹顏色,沒有特定意圖也結構不具任何意義。為了引導繪畫AI,DeepMind訓練了第二個AI作為鑑賞家的角色,其工作便是判斷特定的圖像是由繪畫AI生成的,還是從資料庫真實照片採樣來的。當繪畫AI所繪製的圖畫成功欺騙鑑賞家AI,便會得到獎勵。

DeepMind表示,這與生成對抗網路(Generative Adversarial Network,GAN)的概念相似,但不同之處在於,使用生成對抗網路的系統會直接輸出畫素,而DeepMind的繪畫AI則是透過程式控制繪圖工具來生成圖畫。

繪畫AI經過學習並模仿MNIST手寫數字辨識資料集,繪製出手寫數字的樣貌,這個過程只有對繪畫AI展示數字的圖樣,卻沒有展示數字的繪製過程。為了欺騙鑑賞家AI,繪畫AI學會了操作畫筆,並繪製不同風格的數字。

DeepMind將繪畫AI應用到人臉照片資料集上,繪畫AI能夠捕捉臉部的主要特徵,像是形狀、色調與髮型,DeepMind表示,其繪製的過程就像是,街頭藝人使用有限畫筆描繪肖像一樣,而其代表的意義,便是證明他們有能力引導人工智慧,在與人類使用相同工具的條件下,產生類似的成果。


Advertisement

更多 iThome相關內容