當Hadoop技術問世後,大數據儲存及處理的問題便獲得了解答。但受限於Hadoop MapReduce 框架的運算速度過於緩慢,讓使用者無法有效應用機器學習技術於大數據分析上,以致使用者即使擁有了資料金礦,卻抱著無法有效挖掘出價值的缺憾。加州大學柏克萊分校的AMPLab 便使用記憶體內(In-Memory)運算技術開發出開源叢集運算框架Spark,彌補MapReduce 運算速度緩慢的缺點。善用SparkR,資料分析人員不但可妥善利用原本R語言所提供的資料分析與圖形化套件分析資料,更可透過Spark的分散式運算,有效解決大數據的運算問題。

為了滿足業界需求,資策會特規劃「大數據分析-使用SparkR」課程,讓學員快速學習到Spark 運算框架的優點及SparkR 的運作原理,藉由實作課程,可更加了解該如何使用SparkR,進行大數據的處理與分析。課程透過實際案例操作,可快速瞭解Spark運算框架的優點,將SparkR導入至企業內部應用。2018/7/7~7/8 周末假日班,2018/6/29前報名享早鳥優惠價。

詳情請見: http://www.iiiedu.org.tw/ites/SPARKR.htm (資策會廣告)

熱門新聞

Advertisement