PyTorch 1.2加入新的模型編譯API

開源深度學習框架PyTorch開發團隊釋出了最新的PyTorch 1.2，這個版本的重點在增加了新的模型編譯器TorchScript API，並且擴展了開放模型格式ONNX輸出功能，另外，音訊、文字和電腦視覺應用函式庫，也都發布了新的版本，以配合最新的PyTorch核心。

開發者可以使用TorchScript，將PyTorch模型序列化以及最佳化後，在正式生產環境提供服務，TorchScript是一個編譯器，可以將PyTorch模型轉換成靜態類型圖表達（Graph Representation），為不支援Python的受限環境，提供執行PyTorch模型的方法。開發者也可以將模型轉換成TorchScript，並且將編譯後的代碼與Python一併使用。

而TorchScript在PyTorch 1.2的更新，擴充對TorchScript的支援，除了增加了一個更簡單使用的API，幫助開發者將模型編譯為TorchScript外，還支援更多可用於PyTorch模型的Python子集，包括Python程式語言的結構（Construct）以及標準函式庫，像是for迴圈、zip()與enumerate()等基於迭代的結構，還有支援數學和字串函式庫，與其他Python內建函式。

現在也更完整的支援ONNX Opset匯出，在PyTorch團隊與微軟合作之後，提供了匯出ONNX Opset 7到10版的支援，而且為支援最新的ONNX Opset 10，PyTorch 1.2還加入了常數摺疊（Constant Folding）傳遞。在PyTorch 1.2中，ScriptModule支援多輸出、Tensor Factories，並可在輸出與輸入使用數組（Tuples），開發人員也可以註冊自己的符號，以輸出自定義的操作，或在匯出時指定動態輸入的維度。

PyTorch領域函式庫則提供常用的資料集和模型等，讓開發者快速創建特定領域的基線程式，並且提供常用的功能抽象，減少開發者重複撰寫的樣板程式碼，在釋出PyTorch 1.2的同時，開發團隊也更新音訊應用類Torchaudio、文字應用類Torchtext和電腦視覺應用類Torchvision三個函式庫，以支援最新的PyTorch核心。

Torchaudio是一個機器學習函式庫，內建訊號處理功能，其使用PyTorch的GPU功能，提供波形轉換等工具，使音訊資料更易於使用，新版Torchaudio經重新設計釋出0.3.0，重點是提供了標準化以及複數功能。Torchtext則能加速自然語言處理應用的開發，新的0.4.0版本加入數個監督式學習基線，開發者可簡單地將資料載入使用。Torchvision推出0.4版本，現在新支援影片，以及資料載入、預訓練模型和轉換功能。

熱門新聞