臉書以PyTorch改寫物體偵測函式庫釋出Detectron2

臉書在去年的時候釋出了物體辨識開發函式庫Detectron，現在臉書重新以PyTorch改寫釋出Detectron2，新版本支援了多種新模型和功能，並把訓練工作管線移到了GPU，讓新版本的模型訓練速度比Detectron快上許多，另外還採用了模組化設計，更靈活也更容易擴充。

Detectron是臉書人工智慧研究員開發的電腦視覺函式庫，可以快速地從影片或是圖片中，辨識物體，物件的形狀和邊緣。Detectron第一個版本以Python開發，使用深度學習框架Caffe2，但是Detectron2轉換使用臉書在去年底釋出的深度學習框架PyTorch，PyTorch可提供更直觀的指令式程式設計方法，讓研究人員能快速迭代模型和實驗。

而全新的模組化設計，讓Detectron2更靈活且容易擴充，用戶可以將自定義的模組實作插入物件偵測系統各個部分中，也就是說，用戶可以方便地使用Detectron2來完成其他人工智慧研究，因為其撰寫的研究實作程式碼，可與核心Detectron2函式庫程式碼完全分離。

Detectron2除了提供Detectron中的所有模型，包括Faster R-CNN、Mask R-CNN、RetinaNet和DensePose之外，還新加入了Cascade R-CNN、Panoptic FPN和TensorMask，此外，臉書還添加了同步批次處理規範，並支援LVIS等資料集。

Detectron2支援了一系列和物體偵測有關的新功能，在原始的Detectron版本，可用框、實例分割遮罩來標出偵測到的物件，以及預測人類動作，而Detectron2增加支援語義分割，還有結合語義分割和實例分割的全景分割。臉書將Detectron2的訓練工作管線移動到GPU中，以提高整體的運作速度，現在使用者還可以將訓練分散到多個GPU伺服器，讓大型資料集的訓練工作更加快速。

臉書也實作了額外的軟體層Detectron2go，讓開發者可以更簡單地在產品中部署模型，Detectron2go的功能有內部資料集的標準訓練流程、網路量化以及為雲端和行動裝置模型轉換最佳化。

臉書設計Detectron2是要滿足自家人工智慧研究的需要，並且為臉書產品提供物體偵測的功能，像是為Facebook Portal視訊通話裝置中的智慧攝影機，提供下一代姿勢偵測功能。臉書提到，把Detectron2用做跨研究以及產品中的統一物體偵測函式庫，可以讓他們快速地把研究中的功能，轉移到大規模部署的產品模型中。

熱門新聞