Amazon Redshift是一種支援SQL的雲端資料倉儲服務,可以處理以ODBC和JDBC連結為基礎的其他應用程式的連結,且使用PostgreSQL驅動程式。另外。Redshift叢集建立後還可以修改(Modify)、調整(Resize)、關閉(Shut Down)和重新啟動(Reboot)。

圖片來源: 

Amazon

網路電子商務公司亞馬遜(Amazon)於2012年11月釋出Redshift測試版,正式版在2013年2月才推出。

不過,Gartner今年3月首度將Amazon列入資料倉儲資料庫管理系統魔力象限的資料倉儲廠商之一,和傳統資料倉儲廠商並列,Amazon也是報告中唯一一家只提供雲端資料倉儲服務,而沒有提供本地端產品的廠商。

Redshift是一個PB級雲端資料倉儲服務,目前有超過2,000名用戶,包含Airbnb、Nokia、Isobar、Nasdaq Omx、Pinterest等。

不同於Amazon託管資料庫服務是以關聯式資料庫技術,來處理儲存在欄位導向的資料庫管理系統(Column-Oriented DBMS)中的大規模資料集(Dataset)分析工作。

Redshift則是一個大量平行處理架構(Massive Parallel Processing,MPP)的資料倉儲,且提供了SQL語法為基礎的工具,在用戶分析各種大小的資料集時,也可以提升查詢效能。

Redshift也採用了其他的技術,包含欄位的資料儲存(Columnar Data Storage)、強化壓縮(Advanced Compression),以及高效能I/O和網路等,來達到比傳統資料倉儲和傳統資料分析工作更高的效能。

另外,用戶只需要透過點擊的方式使用AWS管理控制臺(AWS Management Console),就可以啟動Redshift叢集。

不過,企業要自己管理和建置資料倉儲需要投入大量的時間和資源,尤其是當企業面臨龐大的資料集時,更是如此。

且在資料倉儲中,下載、監控、協調、備份和從錯誤中復原資料等工作都相當複雜且耗時。

而Amazon Redshift提供企業建立、維運和擴充資料倉儲的服務,也有提供監控和備份叢集的功能,以及Redshift各版本的補丁和更新。

Amazon Redshift也提供持續監控叢集健康狀況,以及自動更換需要替換的元件的服務。

此外,Redshift可以在節點叢集中分散和平行查詢,用戶不需要手動調整查詢、維護索引或預先運算結果,以達到高效能查詢。

Amazon Redshift也與其他AWS服務相容,且內建指令,用戶可以將來自Amazon S3、Amazon DynamoDB或EC2,以及使用SSH的本地端伺服器中的資料平行分散至各個節點,且節點可以線性擴充,另外,用戶可使用DDL將資料自動分布和排序。

 

相關報導請參考「資料倉儲上雲端」


Advertisement

更多 iThome相關內容