Nvidia推出名為RAPIDS的機器學習平臺,其包含的軟體函式庫可以讓資料科學家方便的使用GPU的運算能力,執行端到端的資料科學以及分析工作管線,RAPIDS使用CUDA進行低階計算最佳化,並提供Python介面方便資料科學家使用GPU的高效能運算能力。

RAPIDS的目的是要提供企業高效能運算能力,以解決需要處理大量資料的高度複雜問題,像是信用卡盜刷、預測庫存或是了解消費者的購買行為。Nvidia創辦人兼執行長黃仁勳提到,現今企業越來越仰賴資料驅動,而資料分析以及機器學習現正是高效能運算的熱門領域。

開源的RAPIDS是一套基於GPU分析的CUDA加速函式庫,可用來執行機器學習以及資料視覺化,目前現階段提供了五個熱門機器學習函式庫,並加上了GPU加速,如此便能更快的迭代並最佳化人工智慧訓練,以獲得更好的模型準確度。

RAPIDS是Nvidia和開源社群花費兩年共同打造的平臺,Nvidia表示,這是第一次為資料科學家提供在GPU上執行資料科學工作所需要的完整工具。該平臺使用XGBoost機器學習演算法,在Nvidia DGX-2TM系統上進行訓練,其實驗結果顯示,與僅使用CPU的系統相比,速度提升了50倍。這將能讓模型訓練時間從數天縮短到數小時,數小時下降至數分鐘。

RAPIDS建立在熱門的開源專案上,包括了Apache Arrow、Pandas和Scikit-learn,並在Python資料科學工具鏈中加入了GPU加速。而且為了增加RAPIDS的功能,黃仁勳提到,Nvidia有多個相關專案正在進行,正與Anaconda、BlazingDB、Databricks、Quansight和Scikit-learn等開源生態貢獻者合作。

Apache Spark技術團隊所創立的企業Databricks創辦人Matei Zaharia表示,他們對RAPIDS能夠加速Apache Spark工作負載感興趣,現在正進行多個計畫,以便整合Spark與原生加速器,其中包括對Apache Arrow的支援,以Hydrogen專案進行GPU排程,Databricks認為,RAPIDS將能擴展企業在資料科學以及人工智慧方面的工作負載。 

RAPIDS獲得一系列大型科技公司的支援,其中包括甲骨文透過Nvidia Cloud在Oracle Cloud Infrastructure上支援RAPIDS,並且也將在Oracle Data Science Cloud中支援。而IBM也宣布將在企業機房、公有雲、混合雲和多雲環境中,透過IBM Cloud、PowerAI和IBM Watson Studio支援RAPIDS。Nvidia還提到,Hp、思科、戴爾和聯想也都將在自家系統支援RAPIDS。


Advertisement

更多 iThome相關內容