圖片來源: 

iThome

59歲的臉書首席AI科學家Yann LeCun,從大二第一次接觸到機器學習點燃好奇心之火至今,大半輩子都投入了這個領域,也在機器學習、計算機視覺、移動機器人和計算神經科學等領域都有許多貢獻。其中最為人知的是,他在1989年任職貝爾實驗室期間,發表了卷積神經網路(CNN)框架LeNet,奠定了日後深度學習的基礎架構,因此,他也被稱為CNN之父。

就算幾度面臨深度學習領域的寒冬,Yann LeCun仍不斷從事研究、發表論文,甚至自己動手設計卷積神經網路專用晶片,試圖想解決當年硬體效能不足的問題。直到2012年,ImageNet競賽使深度學習重回主流舞臺,他的貢獻也才重新得到肯定。

Yann LeCun再次來臺開講,揭露對深度學習未來發展的觀察和預測,全場爆滿,結束後的講臺上仍聚集了大批學術粉絲和聽眾輪番提問。我們從演講、會後提問和採訪中,整理出10個問題,可以快速了解他力推的自監督式學習。

 

 Q1  為何要將非監督式學習稱為自監督式學習?

如果你告訴媒體,這是用非監督式學習(Unsupervised Learning)訓練的模型,不熟悉科技的人可能誤以為,「天啊!機器不受控制,會自己訓練自己!」我認為,應該用更精確的詞來稱呼,也就是「自監督式」學習。

 

 Q2  自監督式學習、監督式學習和強化學習,三者有何不同?

可以用蛋糕來比喻三種方法的預測能力,強化學習能預測的資料最少,因為它是為了獎勵,才能做出少量正確的預測,就像蛋糕上的櫻桃。而監督式學習的預測資料量,取決於人類提供的標記資料,一個樣本能回饋10到1萬個位元(Bits)不等的訊息,像是蛋糕的表層。

但是,自監督式學習是,給多少資料就有多少資料能觀察,一個樣本能產生上百萬個位元的預測回饋,就像整個蛋糕本身,這是其他學習方法不能及的。

 

 Q3  自監督式學習有的預測方式有哪些?

自監督式學習,是觀察現有訓練資料中的任何部份來學習,再去預測未知的部份,且不仰賴人類給定的標籤。可以進行的預測包括:從過去的資料預測現在或未來、從近期的資料預測未來或過去、或從同一時間下的其他資料預測缺失的部份等。

 

 Q4  為何自監督式學習有機會讓AI具備人類常識能力?

一般稱呼具備人類常識的AI模型為Artificial General Intelligence(AGI),但我認為,人類能擁有常識是非常特別的事,一點也不平凡,所以,我更偏好稱呼它為Human Level Intelligence。

舉例來說,雖然只有一句簡短的話:「John拿起他的書包並離開會議室。」但你可以從這幾句話中了解到大量的信息,比如,John應該站了起來並拿起書包,接著,他走向門、打開門離開會議室,此時,會議室就不會有John這個人,因為他不會同時存在於兩個地方,這是屬於物理世界的約束。人們能透過常識來判斷這些隱性資訊,常識使我們能填補空白。也就是說,自監督式學習能從許多的物件、行為等背景知識,來學習整個世界運行的方式,進而運用已知的常識來預測未知。

 

 Q5  自監督式學習的研究目前有哪些進展?

自監督式學習目前在自然語言處理(NLP)的應用頗有成效。比如去年Google對外開源了用於自然語言預訓練的新技術BERT,能在一個挖空15%內容的句子中,預測字彙並補上這些句子的空白。除了NLP,圖像的填空是更具挑戰性的任務,但現在也已經能夠過拼圖與著色問題的解法來預測。

 

 Q6  你自己有何成果?

我研究自監督式學習最主要的動機,要找到讓機器學習更像人類或動物學習的方法,所以,對應用層面的研究較不感興趣,反而是專注於找出一套原則,能讓機器變得更聰明。

在研究方面,臉書已經將自監督式學習運用到對話領域。你若看過電影Her,就知道這部電影是在描繪人與虛擬語音助理之間,可能產生的互動模式。虛擬語音助理要能順暢地與人類溝通,就必須要學習人類認知的方式,可能還需要能理解人類想法、甚至猜到你要說的話。

其他研究,包括靠自監督式學習讓自駕車可以預測周遭車輛的未來動向,來決定下一步的行駛軌跡,或是透過肌肉運動來預測接下來的手臂動作。雖然現在的科技,距離電影情節的實現還很遙遠,但,這是一個我們嚮往的藍圖。

 

 Q7  自監督式學習會領導機器學習的未來發展嗎?

這是我所希望的,但現在只是假設。

我們現在已經具備的AI技術,包括更安全的自駕車、更精準的醫療影像辨識、個人化藥物配置、適當的語言翻譯、實用但不聰明的聊天機器人、資料檢索與過濾,還有其他如能源、金融、製造業、環境保護、商業、法律、藝術創作、遊戲等場景的應用。

現今的深度學習方法,雖能帶給人類許多新科技應用,卻無法創造出「真正的」人工智慧,也就是具備常識、聰明、敏捷且靈活的AI。自監督學習可能是實現這個理想的第一步,甚至未來發展出具備人類常識的機器人,走到強人工智慧的階段。

 

 Q8  AI的不可解釋性會成為深度學習發展的挑戰嗎?

對於特定需要解釋性AI的應用來說,這是一個挑戰,比如運用AI來做合法、正義的決定,就必須了解決策背後的原因。但我認為,這只是人們用來重複說服自己的方法,絕大多數的應用並不需要解釋,而且很多時候,人自己也無法解釋。

試想有一套決策系統,提出了兩個建議,一個是正確性80%的可解釋性建議,另一個是正確性95%的不可解釋性建議,若你是研究員,會如何選擇?我相信,絕大多數的人會選擇正確率更高的決策,而非過度在意其解釋性。

再舉個例子,阿斯匹靈是世界上服用人數最多的藥,經過白老鼠到人體試驗來證明藥效後,廣泛使用在藥物治療上,但直到1970年代,我們並不了解為何它能治病、如何在體內運作。換句話說,就算AI缺乏解釋,只要能全面的驗證其有效性與可靠性,仍然可以被使用。不能只追求AI的解釋性,卻忽略其可用性。

 

 Q9  為何你會決定投入神經網絡的研究?

當我還是個電子工程系的大學生,我就著迷於人類擁有智慧(Intelligence),1970年代晚期,我偶然看到一本哲學書,關於語言學家喬姆斯基和兒童心理學家皮亞傑的辯論,「從人的語言機制和語言習得角度來探討兒童發展問題」,才得知皮亞傑一直在研究感知器(Perceptron)模型。

這是我第一次接觸到深度學習的概念,已是感知器(Perceptron)提出十幾年後。當我開始閱讀1960年代的文獻時,機器學習就進入了停滯期,只剩下一些日本等國學者還在研究。1980年代,機器學習重新受到關注,看著那些舊論文,我意識當時多層神經網絡的演算法被忽略了,所以,我開始朝這個領域展開研究。

 

 Q10  為何選擇進入臉書而不是其他企業?

因為臉書是一家非常開放的公司,給我從頭開始創建研究實驗室的自由,就技術而言,臉書基本上沒有秘密,大部分技術都已開源釋出,甚至連基礎建設的設計都已開源,這是其他公司無法做到的。比如在Google,會規畫出研究領域的大方向,而在Amazon或Apple更不可能,因為它們是非常秘密的企業。

熱門新聞

Advertisement