專用於資料庫PostgreSQL的擴充套件PipelineDB釋出1.0版本,PipelineDB能以連續多SQL查詢,進行高效能時間序列聚合,特別在大規模的即時使用案例上,使用者能感受到出色的效能表現。目前以Apache 2.0授權釋出,支援PostgreSQL版本10.1、10.2、10.3、10.4和10.5。

PipelineDB是一個開源的PostgreSQL擴充套件,能連續聚合時間序列資料的大型串流以產出即時報告。通常,儲存許多原始時間序列資料且不斷聚合往往會出現沒有效率的情形,而這正是PipelineDB能夠良好發揮的地方,PipelineDB在僅需要摘要資料的分析使用案例,像是即時報告儀表板,對於大規模資料擁有極佳的操作性。

相較於傳統資料庫的使用範式,將所有原始資料儲存在資料庫中,在需要的時候才根據需要查詢,PipelineDB讓用戶能透過串流時間序列資料上連續聚合,並且只將這些連續查詢的壓縮輸出結果,以增量的方式更新到表格資料列,提供最少延遲時間的查詢。

這個顛倒資料庫的想法,來自於為廣告應用AdRoll建立大規模資料基礎設施的經驗,由於現有方法不足以處理龐大的原始資料量,因此PipelineDB開發了新方法,才能低延遲處理序列資料串流。在三年多以前,PipelineDB並非以擴充套件的形式存在,而是PostgreSQL的一個分支,由於使用者的要求,使他們開始思考以不同的方式提供服務。

經過了一段時間的發展,PipelineDB逐漸成熟,現在全球已有數千組織採用,包括財富100強企業,在財務穩固的情況下,PipelineDB才開始以擴充套件的形式提供。這個擴充套件是從0.9.7版本開始發展,每個版本都以成為獨立擴充套件為目的,因此包括1.0版也沒有激烈的介面改變。PipelineDB 1.0.0目前支援PostgreSQL版本10.1、10.2、10.3、10.4和10.5,而支援PostgreSQL 11的二元檔案也即將發布。

PipelineDB現在被打包成輕量級的擴充套件,使用者將可以期待更短的發布周期,而且在下一個版本中,將會新增連續視圖自動分隔(Automated Partitioning for Continuous Views)功能。官方表示,這是一個常見的使用模式,以分、小時和天來總括時間序列,而且藉由時間區間來分隔資料,將能讓使用者在連續視圖的查詢結果隨著時間推移。

過去PipelineDB是以GPL v3授權,但是PipelineDB現在重新以Apache 2.0授權。考慮要將PipelineDB以擴充套件形式釋出時,官方重新思考了授權方式,官方提到,雖然強制性開源和自由開源許可都各有優劣,但最終還是選擇較符合公司文化的自由開源許可,也希望藉由更廣泛的採用,建立出強大的社群,並以可持續業務模式,支援公司的這些開源軟體。

熱門新聞

Advertisement