圖片來源: 

Google

Google在今年Cloud Next大會宣布,為公共資料提供額外的5PB BigQuery儲存空間。Google在這階段特別專注提供,可支援BigQuery上GIS新功能如BigQuery Geo Viz,7個可用資料集,不只夠方便使用者進行地理空間查詢,也幫Google省了BigQuery運算資源。

Google雲端公共資料集計畫(Google Cloud Public Datasets Program)在2016年時推出,與許多公共資料供應商合作,在Google雲端存放高價值和高需求的公共資料集副本,讓資料更易於使用和探索。目前BigQuery中託管了超過100個公共資料集,這些資料集內容遍布各領域,包括美國地質調查局(USGS)的Landsat資料,也已經能在雲端儲存使用,使用者可以比過去更快速的存取大量的氣象衛星資料。

而Google也為這些公共資料集提供了實驗工具箱,讓使用者可以進行資料分析,也為那些想擴充自己資料集的人員和組織,提供了有用的儲存庫。用戶每個月可以免費查詢1TB的資料,而自從為公共資料集計畫啟動以來,BigQuery已經提供了95PB的公共資料查詢。

Google也一直與專家合作,確保這些資料集能以最佳實踐提供,以託管有助改善使用者工作流程的資料集,並最大限度地發揮資料的價值。Google與國家海洋和大氣協會(NOAA)等資料提供組織建立了合作關係,根據主題由專家定義的方法儲存與描述這些資料集。在收到用戶對於這項工作的正面回饋後,Google決定擴大該計畫。

在今年Cloud Next大會中,Google宣布為公共資料集提供另外5PB的BigQuery儲存空間,Google表示,這樣規模擴展能夠託管更多有用的資料集,特別是可用於BigQuery地理資訊系統像是BigQuery Geo Viz的資料集,Google從Cloud Next大會以來,陸續新增了7個資料集,這些資料集透過像是郵遞區號製表區(ZIP Code Tabulation Areas,ZCTA)等參數來定義美國邊界,並支援地理空間查詢,除了能幫助使用者應用地理空間資訊,更重要的是,託管這些資料集,反而能大幅減少BigQuery Geo Viz進行地理空間分析,所需的運算資源。

Google將繼續策畫BigQuery上的託管資料集,讓用戶可以透過BigQuery上的機器學習,使用標準的SQL語法就能分析資料,同時也努力減少使用地理空間資料集和應用機器學習技術所需要的工作量。Google提到,他們提供的5PB儲存空間將會在5年內部署完成,履行他們在公共資料集上的承諾,努力消除這些高價值資料的存取障礙。


Advertisement

更多 iThome相關內容