關於巨量資料的概念,業界眾說紛紜。其中最著名的是權威研究機構Gartner給出的定義:巨量資料是
超出常用硬體環境和軟體工具在可接受的時間內為其用戶收集、管理和處理資料的能力。巨量資料的“巨量”並非單純指資料容量,其他如處理資料的速度、資料複雜度和多樣性都是巨量資料的關鍵特徵。

AD:2013雲端計算架構高峰會精彩議程

  關於巨量資料的概念,業界眾說紛紜。其中最著名的是權威研究機構Gartner給出的定義:巨量資料是
超出常用硬體環境和軟體工具在可接受的時間內為其用戶收集、管理和處理資料的能力。巨量資料的“巨量”並非單純指資料容量,其他如處理資料的速度、資料複雜度和多樣性都是巨量資料的關鍵特徵。

  巨量資料往往來自全新的資料來源,其中非結構化資料是絕對的生力軍。非結構化資料是指那些不方便使用資料庫二維邏輯表來表現的資料,包括所有格式的辦公室檔案、文件、圖片、XML、HTML、各類報表、圖像和音訊/影片資訊等。IDC報告指出,全球資料量每18個月就會增加一倍,每年全球產生的資料量已經高達40EB(1EB=1000PB),而這些快速增長的資料主要是來自於非結構化資料。

  隨著巨量資料研究的不斷深入,非結構化資料的應用也日益重要。據凱捷諮詢與《經濟學人》資訊部聯合研究顯示,有58%的高管經理人依賴非結構化資料分析來做業務決策。然而,非結構化資料早已超出傳統資料庫的儲存和處理極限,目前很多廠商將其作為單獨的技術來挑戰。

  為了進一步説明企業處理不斷增長的非結構化資料,全球最大開放原始碼技術廠商紅帽公司,針對非結構化資料推出了開放原始碼儲存軟體解決方案Red Hat Storage Server 2.0,也稱紅帽儲存伺服器2.0。

  紅帽儲存伺服器2.0:巨量資料管理利器

  紅帽是全球知名的開放原始碼解決方案提供商,使用社群驅動的方式提供可靠和高性能的雲、虛擬化、儲存、Linux和中介軟體技術。作為第一家收入突破10億美元的開放原始碼廠商,紅帽認為開放原始碼的商業模式具有無限潛力。紅帽公司總裁暨執行長衛赫士在去年訪華時曾表示,紅帽在未來五年內銷售收入將突破30億美元。

  紅帽最受歡迎的產品當屬紅帽企業Linux,這是全球應用最廣的Linux產品,也是帶領紅帽達到巔峰之作。然而紅帽的發展不限於此,其產品策略的制定是緊隨不斷發生變革的IT趨勢。近幾年,隨著雲端產業不斷深入的發展,紅帽提出以雲端計算、虛擬化及建構混合雲生態系統為重點的產品策略。伴隨2013巨量資料元年的到來,紅帽的產品策略也開始朝向巨量資料發展,據衛赫士預測,在未來的20年裡,巨量資料將會成為主流技術,並改變許多企業的核心價值。
儲存伺服器2.0是紅帽進軍巨量資料的主要產品。紅帽儲存伺服器2.0是一款可向外擴展開放原始碼儲存軟體解決方案,主要用於巨量非結構化資料的管理,是行業中第一個能和物件儲存輕鬆整合在一起的檔案儲存解決方案,可以有效擴展並滿足非結構化資料暴增的需求。它可以配置在預設平台中,也可以配置在私有雲、公有雲或者混合雲環境中,用來優化儲存密集型企業級工作負載。

  追本溯源,這款開放原始碼儲存軟體是來自紅帽2011年10月收購的Gluster,Gluster是一家專注於橫向擴展儲存的開放原始碼軟體初創公司,其GlusterFS開放原始碼檔案系統和Gluster儲存平臺軟體堆疊核心技術,為巨量資料的儲存管理與存取提供支援。其中,GlusterFS開放原始碼檔案系統是一套可擴展的開放原始碼集群檔案系統,能夠輕鬆為客戶提供全域命名空間、分散式前端以及高達數百PB級別的擴展性。

  GlusterFS類似Hadoop中的HDFS,和HDFS比較其最大優勢在於:它通過使用其自有的彈性Hash演算法,在沒有借助中繼資料情況下,實現網路附加儲存的大規模擴展。中繼資料是用來描述資料的資料,在某些情況下可能成為HDFS失敗的元兇,抑或阻礙線性的可擴展性。GlusterFS的這一特點大大的提升了資料定址存取的速度,同時消除了其他巨量資料系統常見的單點故障,資料冗餘負荷與無限擴展的瓶頸。

  此外,紅帽儲存伺服器2.0還能夠與Apache Hadoop完美相容,及提供巨量資料的儲存管理與存取。GlusterFS可以Hadoop HDFS整合在一起,也可以作為HDFS的替代產品,實現更快速的檔案存取。紅帽儲存的Hadoop外掛程式為企業提供了一種全新的儲存選擇,為使用者提供企業級儲存的同時,還能保證API相容和本地資料對Hadoop的存取。

  紅帽儲存伺服器2.0在巨量資料的儲存管理和資料訪問層面為使用者提供高性能和可擴展的解決方案。除了儲存,紅帽的巨量資料解決方案還包括Linux、JBoss中介軟體、企業虛擬化等產品家族,並通過開放式混合雲模式來滿足使用者對企業級巨量資料的需求。具體來說,包括以下解決方案:

‧ 紅帽企業Linux:作為紅帽的旗艦產品,企業Linux是管理巨量資料的最佳平臺。由於紅帽企業Linux擅長利用分散式體系解決巨量資料的關鍵需求,使用者可以將紅帽儲存建構在企業Linux系統上,獲得經濟划算的、高可擴展的、高可用性的配置。同時,紅帽企業Linux還能開發出各種安全可靠、易於擴展的巨量資料應用,進一步將資料轉化為商業價值。

‧ 紅帽企業虛擬化:紅帽企業虛擬化(RHEV)是一款針對伺服器和桌面虛擬化的完整虛擬化管理解決方案,是第一個成熟的、完全開放原始碼的企業虛擬化平臺。為尋求更佳總體擁有成本、更快的投資報酬率和避免被單一供應商鎖定,RHEV提供企業真正的策略虛擬化替代方案。企業虛擬化與儲存的結合,能夠使用戶更加安全的存取由紅帽儲存管理的共用儲存區,還能夠為企業降低營運成本、提高可擴展性和可用性,以及更高的性能。

‧ 紅帽開放混合雲:開放混合雲是紅帽的雲計算產品策略,能夠實現巨量資料在公有雲和私有雲之間的輕鬆遷移。雲計算和巨量資料兩者關係緊密,雲計算為巨量資料的儲存和處理提供了良好的平台,並可以在短時間內運用眾多資源處理巨量資料; 巨量資料處理可以將更多的應用帶到雲上,間接推動雲計算市場的發展。

‧ 紅帽JBoss中介軟體:紅帽JBoss中介軟體是一款適用於服務導向架構(SOA)的開放原始碼平台,為創建和部署新的巨量資料應用提供強大的技術支援,並能夠與Hadoop、MongoDB等巨量資料技術進行互動和整合,協助企業運用巨量資料的商機,並解決巨量資料帶來的挑戰。

  紅帽儲存結合企業Linux、企業虛擬化、JBoss中介軟體和開放混合雲組成完整的巨量資料生態系統,為使用者提供靈活、安全的巨量資料解決方案,以滿足企業現在和未來對巨量資料的需求。

總結

  總結來說,紅帽產品的最大特點就是“開放原始碼”,並將開放原始碼做到極致。開放原始碼是巨量資料的靈魂,憑藉開放原始碼的優勢,紅帽巨量資料解決方案發揮著巨大的潛力。未來,隨著紅帽不斷深入巨量資料的研發,以紅帽儲存為主的生態系統,將提供一站式的巨量資料解決方案。屆時,紅帽雲計算和巨量資料產品策略將雙管齊下、相輔相成,共同打造開放原始碼技術創新平台。

熱門新聞

Advertisement