圖片來源: 

攝影/洪政偉

睽違兩年,臉書AI研究院首席科學家、也是卷積神經網路之父Yann LeCun,即將在9月25日再度來臺,參加全球影像處理頂尖會議ICIP大會(ICIP)。這場會議更吸引了超過1千五百名全球產、學界影像處理、影音分析學者和專家來臺與會。連Google、高通、微軟和騰訊等科技巨頭也派出自家資深研究主管,親自來臺揭露最新影像處理AI研究技術或成果。

ICIP會議是IEEE學會旗下國際旗艦型會議之一,26年來首次來臺舉辦,早在5年前,臺大電機工程學系教授陳宏銘、交大電子工程學系教授杭學鳴和南加大電機工程與電腦科學教授郭宗杰,三人開始向ICIP大會提案爭取,希望將全球第一流的影像處理和分析專家,帶到臺灣交流。陳宏銘表示,希望藉此塑造一個讓臺灣業界跟國際學者交流的平臺。

主講者陣容超強,如陳宏銘與杭學鳴兩位教授更是Yann LeCun當年在貝爾實驗室的同事,彼此的座位只隔了一個轉彎,這個30年的交情,讓Yann LeCun一口就答應再次來臺開講。

Yann LeCun不用「非監督式學習」(Unsupervised Learning)這個詞,他選用「自監督式學習(Self-Supervised Learning,SSL) 」,來描述那些不需要事先標記資料的機器學習。他認為,多數深度學習都是仰賴大批標記資料的深度學習,但人和動物大多數的學習成果,多來自觀察和突發性的行為,他想要從這個角度,來思考如何運用自監督式學習來打造一個可以用來預測失落片段的機器,例如句子中少掉的詞,圖片的破損,影片的下一個訊框,然後可以找到通則來「填滿」它,讓文句、圖片或影片得以完整。Yann LeCun將會在演講中提出一套特別適合用於影像補全或影片預測的SSL模式,也會以自駕車訓練為例說明。

另一位Keynote講者法國洛桑聯邦理工學院(EPFL)教育單位副校長Pierre Vandergheynst,則是從影像的上游,也就是圖形訊號的角度來剖析AI的可能性。他曾是多個旗艦期刊的副主編,如IEEE的信號處理(Signal Processing)或SIAM的影像科學(Imaging Sciences),目前聚焦在如何將圖形訊號處理(Graph Signal Processing,GSP)運用到更多機器學習和網絡科學的應用,他也將從圖形訊號處理的根本,重新思考幾種關鍵作法在AI系統中的發展和未來趨勢。

主辦方更找來HTC健康醫療事業部總經理張智威,來展現臺灣技術經驗,曾任Google中國研究院院長的張智威現為HTC DeepQ部門總經理,他將揭露有關醫療照護的最新科技進展,包括AI、VR、區塊鏈等技術的應用。

影像處理研究趨勢,走向小數據與非監督式學習

這屆大會收到的影像處理相關論文超過2,000篇,只有945篇通過將在會中發表,接受率約45%,其中,來自中國的論文最多,共有336篇,超過總論文量的三分之一;而論文數量第二多的是美國121篇、第三是日本59篇、再來是法國54篇等;而臺灣則有43篇獲選,杭學鳴表示,「一般來說,臺灣研究能量大概有20、30篇,由於臺灣今年為地主國,難得地突破了40篇的規模。」

而今年的熱門題材,仍是以AI為核心的研究,若以主題來分類,「影像/影片翻譯與理解(Interpretation & Understanding)」這類型論文數量最多,提交數量有646篇,接受數量也達到291篇,幾乎是第二名「影像/影片分析(Analysis)」,其142篇的兩倍,也代表了這類研究是近一年來的趨勢。陳宏銘說明,簡單來說,影像理解技術就是讓AI能自動解讀圖片,其應用包括人臉辨識、自駕車的物體辨識與追蹤、照片分類等。

從今年論文發表的結果,杭學鳴也分析近來影像處理的研究趨勢,開始走向用少量數據來訓練AI模型。比如說,過去需要大量標記數據來訓練資料,常在資料標記過程消耗大量人力,如今,則逐漸走向非監督式學習,可能只要先標記十分之一的資料,就能讓AI模型依照先前的模式來學習,需要的資料量也會更少。「因為人類學習不用教一百萬遍,所以AI學習方法一定要突破,才能更加趨近於人類學習的方式。」

此外,這次大會也在9月22號,安排了Tutorials工作坊,邀請14位資深學者就各自專業領域,來開設為期三小時的短期課程,每個課程將專注於一個主題,循序漸進的教導報名者學習特定技術。陳宏銘表示,Tutorials工作坊不僅開放業界參與,也鼓勵業者集體報名,不僅能享有半價優惠,還能一睹國際大師的風采。

Tutorials工作坊的場次與主題。

為搶人才,Google、臉書、微軟、高通和騰訊大秀影音AI最新進展

儘管ICIP是傳統的學術性會議,論文發布者多來自學研界,今年約1500位報名者中,八成是學校師生,但這些人,正是企業極力想招攬的頂尖人才。為此,許多跨國企業也積極贊助,爭取現場展現最新技術的機會。如騰訊、微軟、Google、高通、Facebook等五家將各找來自家資深研究人員,舉辦Workshop,並大會中場休息時間介紹自家技術。

Google找來Google研究技術主管、Youtube影音演算法專家,將揭露如何理解和分析那些來自用戶貢獻的內容,尤其是壓縮和品質評估難題,也會介紹Google在AV1編解碼器視頻壓縮的最新進展。而臉書則要派出多位影音基礎架構團隊成員,例如曾設計出Netflix串流矩陣的Ioannis Katsavounidi,他現在是臉書各種影片品質技術的主管。臉書工作坊將探討如何大規模測量且提高影片畫質,以及採用了哪些措施來降低視頻處理過程中所消耗的能源。

而騰訊就找來自家媒體實驗室的資深研究員,來分享如何運用CNN執行影片處理和增強技術,來構建人類感知影片的服務;微軟則是找來微軟研究院電腦視覺團隊首席研究主管Zicheng Liu帶頭,來分享OCR技術的應用,以及3D人臉追蹤和重建的解決方案。

不只國外科技巨頭,臺灣也有多家企業展現自家產品和技術,包括聯發科、義隆電子、Acer、ASUS、研華科技、AILabs等,陳宏銘表示,「這是非常難得的機會,讓國外學研界對臺灣的技術能力有所了解。」瑞軒科技更是提供了65吋液晶螢幕,作為論文發布用的數位看板,這也是ICIP首次以E-Poster取代紙本海報來展出論文,甚至以多媒體形式來展演研究成果。

這次ICIP大會的傳承意味特別濃厚,因為25年前,主辦第一屆ICIP大會的三位發起者:黄煦濤(Thomas S. Huang)、John W. Woods以及Alan Bovic,前兩位分別是陳宏銘與杭學鳴的指導教授,這次大會等於是徒弟接手。主辦單位首次在會中新增了紀念性質的「特別貢獻獎」,邀請首屆三位主辦人共同參與領獎,除了尊師重道的傳承意涵,也要感念三位大師多年來在影像處理領域的貢獻。

不只是承上,還要啟後,陳宏銘表示,藉著這次與國際接軌的機會,要提拔臺灣AI影像學習的人才,讓下一輩的年輕人不只要參與舉辦活動、觀摩會議的進行,同時也要累積人脈,「將來才能在國際上發揮一己之力。」

ICIP從1994年舉行首屆以來,今年已經邁入第26屆,將在9月22號登場,截至目前,已經吸引全球超過1500名的影像處理領域的專家學者報名,直到活動當天,都能現場報名參加。
 

臺大電機工程學系教授陳宏銘(圖右)、交大電子工程學系教授杭學鳴(圖左),是這次ICIP會議的幕後推手,兩人相識於交大研究所,而後均曾任職於貝爾實驗室,與CNN之父Yann LeCun同在一個實驗室工作多年。

熱門新聞

Advertisement