開源深度學習框架PyTorch開發團隊釋出了最新的PyTorch 1.2,這個版本的重點在增加了新的模型編譯器TorchScript API,並且擴展了開放模型格式ONNX輸出功能,另外,音訊、文字和電腦視覺應用函式庫,也都發布了新的版本,以配合最新的PyTorch核心。

開發者可以使用TorchScript,將PyTorch模型序列化以及最佳化後,在正式生產環境提供服務,TorchScript是一個編譯器,可以將PyTorch模型轉換成靜態類型圖表達(Graph Representation),為不支援Python的受限環境,提供執行PyTorch模型的方法。開發者也可以將模型轉換成TorchScript,並且將編譯後的代碼與Python一併使用。

而TorchScript在PyTorch 1.2的更新,擴充對TorchScript的支援,除了增加了一個更簡單使用的API,幫助開發者將模型編譯為TorchScript外,還支援更多可用於PyTorch模型的Python子集,包括Python程式語言的結構(Construct)以及標準函式庫,像是for迴圈、zip()與enumerate()等基於迭代的結構,還有支援數學和字串函式庫,與其他Python內建函式。

現在也更完整的支援ONNX Opset匯出,在PyTorch團隊與微軟合作之後,提供了匯出ONNX Opset 7到10版的支援,而且為支援最新的ONNX Opset 10,PyTorch 1.2還加入了常數摺疊(Constant Folding)傳遞。在PyTorch 1.2中,ScriptModule支援多輸出、Tensor Factories,並可在輸出與輸入使用數組(Tuples),開發人員也可以註冊自己的符號,以輸出自定義的操作,或在匯出時指定動態輸入的維度。

PyTorch領域函式庫則提供常用的資料集和模型等,讓開發者快速創建特定領域的基線程式,並且提供常用的功能抽象,減少開發者重複撰寫的樣板程式碼,在釋出PyTorch 1.2的同時,開發團隊也更新音訊應用類Torchaudio、文字應用類Torchtext和電腦視覺應用類Torchvision三個函式庫,以支援最新的PyTorch核心。

Torchaudio是一個機器學習函式庫,內建訊號處理功能,其使用PyTorch的GPU功能,提供波形轉換等工具,使音訊資料更易於使用,新版Torchaudio經重新設計釋出0.3.0,重點是提供了標準化以及複數功能。Torchtext則能加速自然語言處理應用的開發,新的0.4.0版本加入數個監督式學習基線,開發者可簡單地將資料載入使用。Torchvision推出0.4版本,現在新支援影片,以及資料載入、預訓練模型和轉換功能。


Advertisement

更多 iThome相關內容