圖片來源/iThome

在OpenStack環境當中,應用相當普及的Ceph儲存系統,本身也是開放原始碼的軟體,採用的是LGL2.1授權模式,允許開發者與一般公司使用,並且也能將Ceph整合到他們發展的軟體上,不需要配合Copyleft授權而釋出自己開發的程式原始碼,這意味著就算是專屬軟體,也能自由運用Ceph。

此外,由於Ceph基於本身的分散式儲存叢集環境,可同時提供物件儲存、區塊儲存、檔案層級的存取,可應用的場景相當多元,因此也吸引各式各樣的人來採用──不論你是只需要當中的特定一種儲存環境,或是同時需要多種儲存環境,Ceph都能滿足。

而且這樣能自由運用的特性,除了對想省錢、想取得更多軟體應用主導權的用戶有利,對於有心發展儲存應用產品的廠商,Ceph也一視同仁,大家均可利益均霑。

開放原始碼軟體崛起,Ceph為新創公司帶來切入市場新機會

不像既有儲存廠商為了更徹底保護自身的利益,而將所開發的產品,大多採用封閉授權的模式。畢竟好東西當然留給自己人用,肥水怎能落入外人田?然而,在各式開放軟體應用大爆炸的現在,產品的採用率要夠高、搶得市場先機,接下來才能再去想怎麼獲益。

而且,傳統儲存廠商在產品的開發模式較為封閉,自身需投入很多時間、人力,把軟體做到盡善盡美之後,再想辦法賣出去,等著用戶捧著大把鈔票上門購買。相較之下,基於開放原始碼模式所發展的儲存軟體,則不是如此,產品設計過程較為透明,並且會與開發者與使用者社群充分互動,再推出符合大家需要的產品,但這種作法相對也有不少代價,例如,因為牽涉到很多人的意見,並無法確保軟體開發期間的效率,時間會耗費得更多,而完成到一定程度之後所發表的成果,也未必經過好好的調校,而達到最佳的執行狀態。

但也因為這些看似缺點的不確定特性,也讓更多能善用的新創IT公司能夠發展起來,或是讓原先無法進入這個領域的企業,獲得入場角逐的資格,所以,在如此態勢之下,開放原始碼並非商業應用的威脅,反而是人人都能夠好好把握的機會,因為你可以基於社群先前所開發的成果,繼續強化、改良,然後可以依據不同授權的要求,選擇將這些程式碼回饋到社群,或是進一步推出自有品牌的產品,即可快速搶市,卻不需要重新造輪,等於站在巨人的肩膀上成長,卻不會被特定廠商所綑綁。

在Ceph身上,也體現了這些特性,甚至因為開放原始碼如今席捲全世界的風潮,帶來更多的應用可能性,除了雲服務業者和企業自行以此建置高擴充性的儲存環境,更有一些新興儲存廠商基於Ceph軟體技術的基礎,來發展自有品牌的產品,或是用它來擴充既有產品的不足之處。而且,這樣的合作讓廠商引以為豪,不再刻意隱瞞,我們可以很清楚地知道,這些產品的技術源頭是Ceph,或僅用其中一部分。過去,這麼做的廠商其實很多,但往往諱莫如深,彷彿是不能揭露的祕密,一曝光就會失去競爭優勢,或失去用戶信任。

而現在,願意公開自身產品是基於Ceph技術所發展出來的廠商,其實越來越多,一方面可能是因為Ceph的多重功能與號稱可無限延展的特色,受到很多用戶的肯定,一方面也是因為Ceph軟體本身仍有不少可擴充、調校的部分,也突顯了投入加值開發的必要性。

就目前我們所知道的,基於或部分採用Ceph技術開發的商用儲存系統,主要有幾家廠商的產品,像是大兆科技(Bigtera)、和沛科技(Hope Bay),SanDisk的InfiniFlash系列全快閃儲存陣列,也在其中一款機型用了Ceph。

另外,我們也找到一些廠商產品強調採用Ceph,像是Scalable Informatics的Unison系列、storageFOUNDRY的Nautilus系列等等。

Bigtera以Ceph打造三種應用產品,充分發揮豐富特性

說到大兆科技,可能大部分人會感到陌生,但若一說到該公司的源起──騰雲計算(TCloud Computing),就比較多人有印象了,騰雲創辦人是趨勢科技董事長張明正,當時他們希望開發出Cloud OS。以及運算、儲存、網路與管理等周邊相關應用技術,不過等到OpenStack興起之後,這部份的發展方向就有了改變,然而,為了支撐雲端環境所發展的儲存系統,卻仍繼續發展,當時的研發團隊後來成立了易雲群集科技(EZ Cloud Tech),而大兆科技是在這之後成立的,目前已經與易雲合併。而這批團隊一開始就慧眼識英雄,相中了Ceph,並與其合作,甚至也曾面見Ceph創始作者Sage Weil,彼此交流。

對於Ceph儲存系統的研發與改良,他們估計本身已投入3年多的時間,自詡是臺灣最早發展這類儲存應用的產品技術的公司,曾推出了名為EZCloudStor系列產品,而到了大兆科技時期,這套產品一度稱為CloudStor系列,現在則叫做VirtualStor系列。

他們認為Ceph就像Linux Kernel,而大兆所做的是將它進一步開發、整合成套件,建構出軟體定義儲存的產品,就比例而言,Ceph占30%,而大兆自己開發的功能,例如,Ceph與企業既有儲存環境接軌,所需要的一些功能,以及效能強化等等,這些部分則占70%。

雖然VirtualStor系列系出Ceph,但若從這套產品實際提供的部署、管理功能,都已做到更為簡化、易於操作的程度,甚至看不出來兩者之間的關聯性,因為大兆已經把功能整合得相當緊密,讓這樣基於Ceph的分散式儲存叢集系統上,都有了不同的面貌,而且都能一一對應當前最主流的儲存應用趨勢。

但如果從EZ Cloud時期的產品,其實就看得出它們骨子裡是用Ceph,因為EZCloudStor系列底下,就包含了OSD和Gateway這兩套產品。

像是VirtualStor目前分成三條產品線:Scaler、SDS Controller、Converger,剛好能針對橫向擴展儲存(Scale-out Storage)、儲存虛擬化(Storage Virtualization)、超融合基礎架構,這打破了我們原本對於Ceph應用的刻板印象,以為只能提供PB等級的超大容量儲存環境,並兼具多副本的可靠度,沒想到竟然能衍生出其他作法,令人想到「一氣化三清」這樣的道教哲學。

此外,幾乎可達到無限橫向擴展是Ceph的一大特色,但這需要建置一定數量的伺服器才可,大兆科技事業開發總監方榮智表示,VirtualStor應用了超融合的概念,讓運算與儲存系統能在一起,號稱只需3個點,就能架構出一套叢集儲存環境。一般來說,Ceph在最小規模的部署模式下,仍需要6臺伺服器,才能建構完整的叢集環境(3臺監控器、2臺MDS元資料管理伺服器,以及1臺OSD伺服器)。

Bigtera儲存系統的應用架構

基於Ceph特有的運作架構,可分為資料層(Data Plane)和控制層(Control Plane),Bigtera發展的VirtualStor系列儲存系統,可提供3大類型的應用。首先是,和Ceph一樣,能夠成為具有無限橫向擴展能力的整合式儲存系統,也就是Scaler這套產品;他們也提供軟體定義式的儲存控制器SDS Controller,將既有環境下的儲存系統予以虛擬化、整併,簡化管理;此外,由於具有橫向擴展能力與軟體定義能力,Bigtera也順勢推出了所謂的超融合式儲存系統,一次整合伺服器虛擬化與儲存系統,亦即Converger。

資料來源:Bigtera,2015年10月

 

Bigtera提供的網頁管理介面易操作,功能強大

管理者可透過狀態儀表板的圖表,掌握目前處於忙線狀態的虛擬磁碟區與主機資訊,以及叢集磁碟的用量、事件記錄。

若要了解各臺儲存節點伺服器與所屬的物件儲存裝置之間的關係,管理者可點選指定主機項目,右側的網頁介面即會顯示對應的上線磁碟資訊。

系統中各個儲存網路協定的I/O存取效能走勢,管理者也可以透過VirtualStor網頁介面查看,當中會依照不同協定區分出各自的圖表。

圖中這項功能,同樣是呈現各儲存協定的I/O表現,管理者也可以選取即時檢視(Realtime View),即能立即查看當下的狀況。

圖片來源/Bigtera

和沛看中Ceph統一儲存特性,並強化伺服器可用性與監控力

另一家也運用到Ceph技術的,則是近年來在臺灣頗富盛名的和沛科技,該公司創辦人暨總經理翟本喬在IT界頗富盛名。目前有ArkEase Pro雲端儲存服務平臺、ArkFlex雲端大規模資料儲存平臺、Ark Express雲端儲存閘道、ArkVoice企業雲端語音錄製平臺。

其中,ArkFlex所導入的磁碟群組機制,即與Ceph有關,藉此讓使用者獲得較大的可用空間,並兼具伺服器節點的容錯能力,以系統預設的6+2的叢集節點運作模式,實際可用空間能達到75%,而最多能容忍同時故障的伺服器是2臺。

而且,對於和沛驗證過的硬體設備,這套系統也支援相關的監控功能,可持續監督伺服器系統硬體。

若以既有的Ceph功能來說,在同樣的叢集規模下,用戶能獲得的可用儲存空間,無法達到這麼高的比例,而且,其可用性主要還是針對資料的保護,雖能提供3個副本的保障,但對於伺服器端的可用性與監控機制,功能仍較為有限。

至於Ceph對於檔案系統支援較為有限的缺憾,ArkFlex也對此進行改良,使其支援CIFS、NFS、iSCSI,讓傳統應用程式若要以這些方式存取儲存系統時,也能與其相互搭配使用。因為在設計上,和沛是將CIFS、NFS、iSCSI建構在Ceph RBD之上,並自行設計實作提供了容錯的功能。

另外,在效能強化的部分,和沛也提供兩種SSD加速機制,可因應IOPS需求較高的應用系統類型。而在叢集環境的部署上,這套儲存系統最少需要4臺伺服器來支應,但他們會建議使用者能一次建立8臺為1組的儲存池。

當初會用Ceph,和沛科技技術總監龐景德表示,他們想尋找能作為雲端儲存後臺的解決方案,需支援物件儲存,又要能橫向擴展規模到很大的程度,早期,和沛曾用Swift,它的確是一個選擇,但由於Swift只能做到物件式儲存,而Ceph應用方式更為廣泛,可同時支援檔案式、區塊式、物件式等各種儲存介面,是全方位、統一(Unified)設計的儲存產品,因此和沛後來決定採用Ceph。

和沛ArkFlex強化監控Ceph主機功能

和沛在旗下的ArkFlex儲存系統當中,採用了Ceph技術,同時也增強一些保護機制,例如這套系統可監控系統的硬體狀態與硬碟相關參數。(圖片來源/和沛科技)

SanDisk用Ceph同時提供區塊儲存與物件儲存能力

去年SanDisk併購Fusion-io之後,今年1月把混合式儲存陣列 ioControl釋出,並將相關業務轉移、成立新的公司NextGen接手,而SanDisk自己在3月推出新的全快閃儲存陣列InfiniFlash系列,最大可提供512TB的儲存空間,效能可達到78萬IOPS與7GB/s的吞吐量,而當中就有一款機型IF500採用Ceph技術,並因此能提供物件儲存與區塊儲存。

SanDisk在此之所以採用Ceph,主要是為了突顯他們支持開放原始碼與開放標準的立場,因為該公司也是Linux基金會與OpenStack基金會的成員,也經常貢獻程式碼給Ceph的軟體與社群,於是,他們會希望將這些技術用於快閃儲存的領域,做到讓人能夠信服的地步,並且持續提供更多樣化的功能,例如具有QoS、提供較易用的操作方式,以及改良效能,使軟體與固態儲存之間的存取效率增加,設法讓Ceph做到快閃儲存應用最佳化,增加耐用度。

他們也提供以政策來控管儲存資源的方法,用戶能針對系統中的不同快閃儲存裝置,來做到分層儲存管理,以及自動化作業。同時,SanDisk開發了新的REST API、命令列介面、圖形化的使用者介面,以便管理底層的儲存硬體資源。之後,SanDisk也會把Ceph異動的部分回饋給社群,以便能夠利益大眾。

至於支援OpenStack的部分,由於SanDisk InfiniFlash用了Ceph,因此與OpenStack相容性沒問題。除此之外,能否與OpenStack的Cinder、Swift等元件之間妥善搭配,也是他們所致力的主要目標之一。

值得注意的是,IF500是SanDisk在InfiniFlash系列的中階機型,至於其他兩款產品,所用的儲存應用系統軟體也各自不同。

目前最低階的IF100整合了Nexenta的NexentaStor,儲存容量可擴展到2PB,這是因為該系統是基於ZFS檔案系統技術,具有彈性增長規模(Resilient Scale-up)、整合式區塊儲存(FC與iSCSI)與檔案式儲存(NFS、SMB)。而最高階的IF700,用的則是SanDisk ION Accelerator,這套軟體源自Fusion-io時期,去年曾推出整合式設備ION Accelerator Appliance,而現在整合到InfiniFlash系列的架構下,主攻高效能需求的區塊儲存應用。

由此可知,Ceph雖然夠獨特,優點很多,但基於不同的產品考量,想要採用或搭配的儲存廠商,也未必會全部把寶押在它身上。

SanDisk新款快閃儲存陣列用Ceph

InfiniFlash系列是SanDisk今年新推出的全快閃儲存陣列,當中的IF500裡面就以Ceph作為主要儲存應用系統,因此這臺設備可同時支援物件儲存與區塊儲存,可擴展的儲存空間規模能到2PB以上。(圖片來源/SanDisk)

具有與Ceph相似特性的產品,有越來越多的趨勢

除了這些基於Ceph技術的產品,Nexenta今年起狂打開放牌,強調他們旗下的產品NexentaStor、NexentaConnect、NexentaEdge,皆是開放式的軟體定義儲存方案(OpenSDS),Supermicro、Dell等伺服器廠商陸續與Nexenta合作,推出整合方案,而在儲存廠商方面,搭配Nexenta軟體的產品也開始出現了,上述SanDisk的IF100即是一例。

不讓Ceph和Nexenta專美於前,有些商用軟體定義儲存產品,則企圖拉攏伺服器廠商,例如EMC的ScaleIO就找上雲達科技(QCT),推出整合伺服器的應用方案。

今年有些新推出的儲存系統,似乎也具有不少與Ceph共通或相似的特質,但我們不太確定是否與Ceph有淵源。例如,喬鼎今年3月推出的VSky A系列橫向擴展儲存設備,在該公司網站發布的消息提到,它可針對物件、檔案及區塊等儲存環境,提供橫向擴充能力,在單一平臺可擴充至PB等級的空間,並能透過單一管理介面操作資料保護,以及物件、NAS、iSCSI SAN等儲存功能。

另一款產品和Ceph的功能相差就比較大了,但也值得留意。例如HGST併購Amplidata後推出的Active Archive System,單櫃已提供4.7 PB的物件儲存空間,並且可無限制擴展規模,資料可用性據說能到15個9(99.9999999999999%),而Ceph的資料可用性是9個9(99.9999999%),相較之下,似乎矮了一截。因此,這套方案也是不容忽視的大資料儲存產品。

相關報導請參考「開放大儲存當道,Ceph從雲走入企業」

相關報導請參考「【開放大儲存Ceph二部曲】Ceph打造伺服器與儲存跨界新變種」


Advertisement

更多 iThome相關內容