AWS釋出寫三行程式碼就能創建高效能神經網路模型的函式庫AutoGluon

AWS釋出只要需要開發人員撰寫三行程式碼，便能產出高效能神經網路模型的開源函式庫AutoGluon，供開發人員應用在處理圖像、文字和表格資料集的機器學習應用程式。 AWS應用科學家Jonas Mueller表示，AutoGluon能讓機器學習的應用更加普及，賦予所有開發人員運用深度學習的能力。

要部署深度學習模型並達到最佳的效能，開發人員需要具有廣泛的專業知識，AWS提到，儘管目前深度學習的應用，仍局限於數量有限的專家，但過去十年簡化深度學習，努力讓專業人員更容易使用深度學習的工作，已經大有斬獲。

AWS舉例，像是過去開發人員需要投入大量的時間，以計算深度學習模型所需要的梯度（Gradient），梯度是向量，用來表示最有效參數的更新，以最大程度降低訓練資料中範例的錯誤，而後來則出現像是Theano等軟體函式庫，可以自動計算高度複雜神經網路的梯度，並且提供樣板程式碼，讓開發人員可以更簡單地利用日益複雜的神經網路架構。

另外，還有像是Keras函式庫，則是深度學習函式庫TensorFlow的抽象，讓開發人員僅需撰寫幾行程式碼，就能指定像是輸入的數量和層數等參數，讓開發者少寫許多重複的程式碼。AWS提到，雖然有了這些改進，但是應用深度學習技術仍有許多麻煩，像是超參數調整、資料預處理、神經架構搜尋以及轉移學習相關的決定等問題。

為此，AWS開發了AutoGluon，AWS提到，開發人員不再需要於設計深度學習模型時，手動嘗試數百種選擇，只要簡單地指定模型訓練時程，AutoGluon就可以利用被分配的計算資源，在時間內運算出最佳的模型。

以往開發人員為了要找出模型的超參數，需要作出許多選擇，諸如神經網路的層數，以及決定網路的結構，同時也要選擇神經網路訓練的方法。Jonas Mueller提到，由於深度學習的不透明性，專家在不少時候做出的選擇，都是仰賴直覺，而非依據可預期的結果，做出合理的判斷，AutoGluon解決了這個問題，因為所有選擇都會在預設範圍中自動調整，而預設範圍可在特定任務和模型表現良好。

AutoGluon網站提供了許多現成的範例，可讓開發者學習將AutoGluon用於表格、文字和圖像資料的方法，對進階的開發人員，AutoGluon網站還有教導使用AutoGluon API的說明，在客製化應用程式中自動改進預測效能的方法。

熱門新聞