全球五百大超級電腦中,由美國能源部國家橡樹嶺實驗室(Oak Ridge National Labs,ORNL)所建立的系統遠近馳名,近5年來,其提供的運算速度更是持續名列前十大。從2004年開始,ORNL根據原本的基礎而發展出一個單位,稱為橡樹嶺領導計算設施(Oak Ridge Leadership Computing Facility,OLCF),主要任務目標是發展出比目前居於領先地位的系統,還要再好上一百倍的超級電腦。

而OLCF的成果之一,就是去年11月拿下世界排名第一超級電腦的Titan系統。這套超級電腦的尖峰運算量可超過20 PetaFLOPS,另一個特色是採用了混合式運算架構,同時結合了CPU和GPU,因此得以克服前一代高效能運算系統所面臨的限制──耗電量與佔用空間。

整個系統總計有18,688個節點,CPU的部份,Titan使用的處理器是2.2 GHz、16核心的AMD Opteron 6200,GPU則是用擁有高達2,688顆CUDA核心的Nvidia Tesla K20X。所創造的尖峰運算量為27.1 PetaFLOPS,當中的24.5 PetaFLOPS來自GPU,剩下的2.6 PetaFLOPS來自CPU。

採用CPU+GPU混合式運算架構,帶來極大省電與空間效益
目前Titan電腦的尖峰用電為890萬瓦,。相較於該單位前一代的超級電腦Jaguar,運算量為2.3 PetaFLOPS,耗電為700萬瓦,足以供應7千戶家庭使用(相當於一座小型城市),而如果要在純CPU的系統中,達到現行Titan 提供的27 PetaFLOPS運算量目標,他們估計需要耗掉8,200萬瓦的電,這相當於8萬戶家庭的用電,相當驚人。

而改用混合式的系統架構後,同樣為27 PetaFLOPS的運算量,他們預估這樣的耗電量,只需純CPU系統的十分之一,從等同8萬戶耗電降至8千戶,新架構所得到的能源效益相當高。

在他們認知裡面,CPU與GPU各有擅場。多核心的CPU適合多工處理的任務,而擁有更多核心的GPU較適合大量資料吞吐的處理,從每個GPU插槽所帶來的效能,以及能源效率來看,都遙遙領先CPU。

空間上,Titan總共用了200座機櫃,佔地404平方公尺,面積與上一代超級電腦Jaguar一樣,運算量卻超過10倍。

展望未來超級電腦的發展
對OLCF而言,目標是發展領先的運算系統,讓科學家能夠處理對於國家與科學領域有重大影響和衝擊的各種高解析度、多層級/多個實體的模擬需求,這樣的運算研究,對於指引像是能源保證、生態永續、科學新發現、全球安全等議題的政策制定,以及進一步創新,是相當必要的。

OLCF會與多個實驗室通力合作。他們的工作是提供運算與資料科學相關所需資源,以便解決世界上最關鍵的科學、工程問題,因此必須建構比其他運算中心強上10至100倍的系統。以2016年來說,需達到100到250 PetaFLOPS,而在2019年預計是1 ExaFLPS。
 


橡樹嶺實驗室規畫的20年超級電腦發展藍圖
OLCF的任務是要部署與建置強大的運算資源,以應付全球等級的新挑戰,提升科學的生產力與進步,解決最大規模的運算難題。而他們對於系統的規畫,一開始就是以20年為單位


Advertisement

更多 iThome相關內容