過去要讓電腦辨識影像通常需要人類先標註特定影像以供機器學習,不過,Google近來實驗的人工神經網路可從大量的未標註資料中自主學習(self-taught learning),而且可自行辨識出人臉、貓或肢體。
參與此一專案的Google研究員Jeff Dean與史丹福大學人工智慧實驗室副教授Andrew Ng說明,在標準的機器學習系統中,若要機器辨識汽車或摩托車,人們必須先蒐集上萬種已標註為汽車或摩托車的照片來進行訓練,但標註非常地耗時費力,而近來自主式學習與深入學習(deep learning)的研究讓他們想到可透過模仿人腦學習程序的人工神經網路來學習與辨識未標註的資料。
迄今多數機器學習所使用的神經網路只有1~1000萬個連結,但他們認為藉由訓練更大型的網路也許可提昇辨識的準確度,因此,開發出一個可用來訓練大規模神經網路的分散式運算架構,並建置一個可存取Google資料中心1.6萬個CPU核心的人工神經網路,使用逾10億個連結,然後讓該神經網路讀取自YouTube影片中隨機擷取的1000萬張照片。
Google軟體工程師Quoc Le說,此一系統含有300萬個神經元與10億個突觸,在經過上述的訓練後,他們開始觀察不同的神經元的表現,像是對特定物件有否強烈的反應,結果發現有一個神經元對貓臉特別敏感。
基本上,該系統對人臉辨識的精確度高達81.7%,對人體辨識的精確度為76.7%,辨識貓的精確度亦有74.8%。
此一實驗證明了即使人工系統不用事先被告知這是人臉或貓,也能透過大量的資料與自主學習辨識這些不同的物件,相關技術將對語音或影像辨識軟體的開發大有幫助。(編譯/陳曉莉)
熱門新聞
2026-01-19
2026-01-20
2026-01-16
2026-01-19
2026-01-20