面對機器學習、人工智慧(AI)的應用與日俱增,我們除了透過效能更強大的CPU、GPU來因應運算需求,有不少廠商開始積極投入FPGA(Field-Programmable Gate Array)架構的應用,而伺服器與個人電腦處理器大廠英特爾,也在2015年併購Altera,正式跨入該領域產品與技術的發展,接著,在2016年11月於美國舊金山所舉行的AI Day大會上,將FPGA列為支撐AI時代的四大關鍵技術之一。

去年11月,英特爾在美國舊金山召開Intel Artificial Intelligence Day的活動,我們應邀參加,在這次大會上,他們提出了因應人工智慧時代來臨的發展願景,並向與會者報告英特爾本身的產品與技術,以及想要提供的使用者體驗,若要達成這個目標,英特爾認為可透過4大技術作為基礎,FPGA正是其中之一。

既然如此,該公司先前在2015年併購FPGA大廠Altera,所象徵的意義也就更為顯著了,而在納入英特爾之後,Altera是以Programmable Solution Group(PSG)的業務單位型態存在。

簡而言之,中央處理器在面臨資料處理的繁重負擔時,可將這些作業移交給FPGA,而且彼此是以線上連接的方式形成處理架構,達到加速的效果,而且無論I/O負載是從網路傳入,或是處理器本身的負載,均可支援直接卸載到FPGA來執行。

過去以來,在異質運算的應用上,多數人經常看到的作法,是以CPU搭配GPU來進行。事實上,在許多整合式設備裡面,也會運用CPU搭配專用的加速器晶片ASIC,例如網路防火牆設備,或是以CPU搭配多用途的加速器晶片FPGA,像是工業控制電子系統。

而當現今各種創新技術如雨後春筍般出現之際,舉凡人工智慧的推理、機器學習、大數據分析、5G連網、軟體定義儲存、網路功能虛擬化,都需要借助上述這些加速運算技術之力,尤其是具有高度可程式化特性的FPGA最被看好,因為用戶能彈性地加以運用,並且透過硬體加速的方式來因應各式需求。

至於產品的發布上,早在2013年,Altera就推出了第10代的FPGA與系統單晶片(SoC)等封裝形式的產品,發表鎖定高階領域的Stratix 10,以及針對中階的Arria 10,並且分別運用了英特爾的14奈米Tri-Gate製程,以及台積電(TSMC)的20奈米製程。而在低階、低功耗系統的部分,直到2017年2月,才推出了Cyclone 10系列。

英特爾FPGA產品線一覽
產品名稱 Stratix系列 Arria系列 Cyclone系列 MAX系列
產品定位 效能最佳 兼具成本、耗電、效能 低成本 非揮發性整合邏輯裝置
產品型號 Stratix 10 Arria 10 GX、 GT、SX Cyclone 10 GX、DP MAX 10
製程 14奈米Tri-Gate 20奈米 20奈米 55奈米

資料來源:英特爾,iThome整理,2017年12月

英特爾旗下的FPGA運算平臺,依照效能高低,可區分為4大產品線:Stratix 10、Arria 10、Cyclone 10、MAX 10。

以其中的Arria 10為例,今年英特爾陸續釋出多種整合應用的消息。例如,針對FPGA用於深度學習與卷積神經網路的運作效能,他們與電信設備廠商中興(ZTE)在1月公布了測試數據——在臉部辨識上,每秒可處理1千張圖片,將設備原始設計的效能提升到10倍以上,並且仍能維持精準度。

而在2月舉行的CES大展上,英特爾發表基於Arria 10 FPGA的自動駕駛車平臺Intel GO,以及運用Arria 10 GX的自動駕駛車等級的解決方案。

著,在6月宣布支援NEC的臉部辨識引擎NeoFace,NEC將軟體智慧財產整合到Arria 10 FPGA,比起先前解決方案,可提供更高的效能與相同的精準度。

到了10月,英特爾特別宣布推出基於Arria 10 GX晶片的FPGA加速卡,全名為Intel Programmable Acceleration Card with the Intel Arria 10 GX FPGA,可簡稱為(Intel PAC with A10GX),是Intel Programmable Acceleration Card系列的第一款產品,可提供OEM廠商組合而成伺服器加速解決方案,讓用戶能夠選購。至於這款加速卡大量出貨的時機,預計會是2018年上半。

Intel PAC with A10GX是一張PCIe介面卡,外面包覆了一層散熱片,難以了解組成的元件,而根據英特爾公布的架構圖與規格資料來看,核心是Intel Arria 10 GX FPGA,英特爾提到這顆處理器擁有115萬個邏輯單元(logic elements),若從這項規格來推論,確切的處理器型號應為Arria 10裡面的GX 1150。
除此之外,Intel PAC with A10GX還配置了2支8GB容量的DDR4記憶體、支援錯誤修正碼(ECC),以及128MB的快閃記憶體、可支援10GbE和40GbE的QSFP光纖網路收發器連接埠,並且內建了FPGA Interface Manager的軟體,並且支援Acceleration Stack for Intel Xeon CPU with FPGAs架構。
所以,單就上述規格而言,Intel PAC with A10GX具有運算、儲存、網路處理的能力,再加上軟體的提供與支援,幾乎就是一套軟硬體兼具的微型系統。

在產品實際搭配的形式上,Intel PAC with A10GX可安裝在基於Xeon處理器架構的伺服器,英特爾強調,在這樣的架構下,能以最省電的方式,支援複雜、資料密集型的應用系統,例如人工智慧的推論處理、影片串流的分析、資料庫加速等。

圖中是Dell EMC在上半年舉行的全球用戶大會,針對第14代PowerEdge伺服器的部份,提到關於預定能夠搭配FPGA的機型,而這裡用到的部份,有可能是Intel PAC with A10GX。

而Intel PAC正式登場之後,其實,這系列產品的布局,也關係到該公司稍早(9月)所提倡的加速堆疊架構——Acceleration Stack for Intel Xeon CPU with FPGAs。基本上,這套架構包含API介面、標準軟體框架、加速的軟體程式庫、開發工具,以及加速環境,讓開發者能夠以高階的角度來進行工作,而不需要擔心底層FPGA的處理,並且有助於用戶未來將程式碼轉移到新的平臺上。

值得一提的是,英特爾針對FPGA應用提供的開發工具裡面,除了該公司既有的Parallels Studio XE,以及Altera的Quartus Prime,還增加了一套軟體開發套件——Intel FPGA Software Development Kit (SDK) for OpenCL;對於通用存取介面的部分,英特爾同時提供了加速引擎技術,稱為Open Programmable Acceleration Engine(OPAE),能與Intel PAC with A10GX內建的FPGA Interface Manager軟體,相互協同合作。

產品資訊

Intel Programmable Acceleration Card with the Intel Arria 10 GX FPGA
●原廠:Intel(02)6622-0000
●建議售價:廠商未提供
●外型:半長半高PCIe介面卡
●採用處理器:Intel Arria 10 GX FPGA(10AX115N2F40E2LG,邏輯單元為115萬個),TSMC 20奈米系統單晶片製程
●重要元件:2支8GB DDR4記憶體、128MB Flash記憶體
●I/O介面:PCIe 3.0 x8(外觀為x16)
●傳輸介面:QSFP埠(可支援40GbE或4個10GbE)
●耗電量:約60瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement