一年一度的雲端技術盛會「2019 AWS 台北高峰會」,於日前圓滿落幕,本次活動的一大亮點,即是在同時間舉辦全球自動駕駛賽車聯盟競賽(AWS DeepRacer League;DRL),意在透過趣味盎然方式,為開發人員提供探索機器學習的機會,吸引近百位選手報名參賽,結果交通大學 CGI Lab 的選手表現亮眼,由 Roger、Eric 兩位同學分別搶下冠軍與季軍,趨勢科技工程師 Jason 則奪得亞軍席次。

AWS 於去年re:Invent 2018 大會宣佈推出 DRL,強調這是全世界第一個開放給所有人參與的自動駕駛賽車聯盟,從 2019 年開始在全球高峰會舉辦系列錦標賽,報名身份無限制,任何人皆可利用僅真實汽車 1/18 大小的 AWS DeepRacer 賽車參賽。

不論有無機器學習背景,都開放報名參賽

選手在參賽前,須先透過 AWS DeepRacer主控台,在線上訓練強化學習(Reinforcement Learning)模型,最終利用訓練好的模型來驅動賽車行進;值得一提,DeepRace平台讓 AI 訓練流程變十分簡單,即使缺乏機器學習或強化學習專業背景的人也能輕易上手,甚至可直接選用由 AWS 預先訓練好的三款模型,只要選定賽道、給定參數便可著手訓練,相當符合 AWS 舉辦 DeepRacer 賽事的初衷,人人都可動手訓練強化學習模型,不僅運用在自動駕駛開發,且促進開發者的交流,使得 AI 更為簡單化、普及化。

前述三種訓練模型,包括了「追蹤中心線模型」,特色在於會激勵車子儘可能靠近軌道中間;「轉向懲罰模型」,激勵賽車使用整個賽道、並對過度轉向進行處罰,旨在找出最佳路徑,讓賽車儘可能在直線上保持平順;「油門懲罰模型」,激勵賽車盡其所能地展現速度於賽道上奔馳,以最短時間完成競速。

綜觀台北 DeepRacer 競賽的報名選手,其中大部分是 IT 工程師,多半都接觸過機器學習領域,至於自備模型與使用大會模型的比例約各半。即便如此,仍有未曾接觸機器學習的人士報名參賽,其間包含高齡者、資管教師,及純粹想體驗競賽的女性,他們志在體驗不在得名,譬如一位企業經營者喊著「我是玩家(Just for fun),他們是玩家(Players)」口號參賽,給人深刻印象,另一名資管老師則為了體驗活動、並做為日後教學參考而參賽。

不可諱言,自帶模型參賽的選手不在少數,甚至有人一口氣自備40多組模型,重複報名不同時段比賽,希望透過不斷參賽與練習,促使自己的模型更臻完善。

談及競賽規則,由選手以 iPad連接 DeepRacer,進行啟動車子、停止車子、油門(加/減速)等三種操作;選手在 iPad 上可看到車子的即時影像,第一時間了解訓練成果;最終誰能運用最短時間完成賽道,誰就是獲勝者。

參賽者可以從AWS既定的三種訓練模型中擇一,給定參數並選定賽道,也可以自備模型來參賽。

交大 CGI Lab 選手表現亮眼,勇奪冠軍盃

兩天賽程結束,來自交大資訊工程研究所 CGI Lab 的 Roger脫穎而出勇奪第一,他表示 CGI Lab 為電腦遊戲與智慧實驗室,平日便已鑽研機器學習領域,實驗室的老師十分重視 DeepRacer 競賽,於是指派他與其他同學報名參加;Roger 原本模擬賽車希望盡量往內線行徑,以最快完成單圈,但訓練過程中發現若將參數設定得太嚴苛,容易產生出界等不利現象,因而透過一次次持續調整,找出最佳路徑模式,讓模型到達最適當狀態,得以創造佳績,按規定可免費參加拉斯維加斯 AWS re:Invent 2019 之旅,令旁人欣羨不已。

持平而論,AWS DeepRacer 不僅是由強化學習(RL)、3D 賽車模擬器及全球賽車聯盟三者打造的 1/18 比例全自動賽車,更是開始使用機器學最快的方法,可以在其中測試最新的強化學習演算法和模擬轉移到實際領域的方法。RL 是一種機器學習技術,會嘗試學習一個策略,讓代理程式觀察環境狀態後、不斷調整行動方案,以實現目標贏得獎勵,例如 DRL 的「代理程式」就是賽車,「環境」是賽道,「目標」是以最短時間完成賽道。

換言之,RL模型是透過代理程式所採取動作的獎勵與懲罰連續程序來學習的,可在不確定的動態環境下訓練系統、達到自主決策,所以非常適用於自動駕駛賽車的情境;同理,企業也可善用 RL 來解決非常複雜的問題,猶如訓練賽車般,訓練對話系統、工業機器人、空調系統(HVAC)、供應鏈管理、遊戲人工智慧等等其他代理程式。引導它們在各自的變動環境中實踐目標,藉以優化企業的作業流程、大幅增進生產力。由此看來,AWS DeepRacer 比賽的背後隱含深切意涵,值得企業持續觀察與探索。


Advertisement

更多 iThome相關內容