圖片來源: 

IBM

IBM Research於本周二(8/8)發布,IBM利用分散式深度學習(Distributed Deep Learning,DDL)軟體來提升深度學習效能,並創下記錄。根據IBM官方部落格,IBM在64個Power系統中,共256顆GPU,透過分散式深度學習軟體,能在50分鐘內訓練深度學習模型ResNet-50,且能讓深度學習模型的圖像辨識準確率達33.8%。

(資料來源/IBM)

以往要部署大規模的深度學習,往往需要花費數天甚至數周來訓練深度學習模型,而IBM Research研究團隊的研究目的著重於,降低以大量資料來訓練大量模型的時間,以及提高機器學習模型的準確度。

IBM研究團隊研發分散式深度學習軟體,不僅提升了深度學習模型圖像辨識的準確度,更縮短訓練神經網路模型ResNet-101的時間。IBM宣稱僅需要7小時,而微軟訓練相同的ResNet-101模型則花費了10天。

根據IBM,現今流行的深度學習框架通常都在一臺伺服器上來擴展多顆GPU,以提升效能表現。不過,IBM Research研究團隊的分散式深度學習軟體,能優化且自動化在數十臺伺服器上,共上百顆GPU的平行運算,以提升處理速度,並縮短訓練深度學習模型的時間。

而IBM採用ImageNet-1K模型,來訓練深度學習模型ResNet-50僅費時50分鐘的記錄,超越了臉書(Facebook)用Caffe2模型,花費1小時來訓練類似深度學習模型的時間。另外,IBM在深度學習模型的圖像辨識準確度(33.8%)也超越微軟的29.8%。

 

IBM分散式深度學習軟體短片介紹:

 

 


Advertisement

更多 iThome相關內容