根據巿場調查報告指出,商業智慧(BI)是當前許多企業的IT部門優先考量的重點發展項目,而ETL則是導入商業智慧成功與否極為關鍵的步驟。所謂的ETL是指萃取(Extraction)、轉換(Transformation)、載入(Loading)等資料整理的三個程序,要產生正確的報表,就要重視資料的正確性與萃取的過程,因為原始資料不正確,或未將資料整理乾淨,導致最後無法得出關鍵性的分析報告,往往是企業導入商業智慧失敗的重要因素。捷冠資訊科技表示,以往ETL的應用觀念多半停留在資料倉儲的範疇,隨著技術的提昇及現代商業規模的重整擴大,ETL除了是商業智慧的必要配備外,更是企業資訊整合不可或缺的工具,而最新一代的ETL同時具備了下列四項的強大能力,企業在導入時可依實際需求多方評估比較:
一、 資料移植(Migrate):
包含將主機資料轉移至開放式平台、將文字檔/ Excel檔案轉移至資料庫系統、將舊系統轉移至新系統,以及將資料檔案轉移至新的應用系統等功能。主要是在不同的平台或是資料庫系統中搬移資料,並未牽涉到太多的資料轉換及變形,因此能否具備利用開放式資料庫系統的大量載入(Bulk Load)功能,實為資料移植效能的重要關鍵。
二、 資料轉置(Extract):
此為大眾對ETL工具最熟悉的運用領域,即是從資料源或作業型資料庫系統(ODS)中,將需要的資料擷取出來,再根據需求的資料形態,將原始資料轉變、彙總再載入資料倉儲或資料超市之中,以供後續分析之用。在資料轉置的程序中,ETL工具所需具備的能力就是廣泛的資料源連接套件,如透過HTTP/HTTPs、TCP及FTP,存取包括XML及文字檔格式的資料;還需擁有連接所有主要資料庫系統或是資料庫大量資料載入器(bulk loader)的能力,可以執行大量新增資料;同時需具備整合結構性的ISAM資料庫的能力,甚至可以整合非結構化的資料,如電子郵件或系統報表;並擁有整合傳統主機系統資料檔案的功能。
三、 資料介面(Interface):
ETL工具也同時扮演企業內應用系統之間資料交換的中介,但要在不同的應用系統間做溝通,不僅要能解譯各種資料庫格式及資料檔案格式,還要能處理現今各種標準的資料交換格式,如SAP、JD Edward及其他的ERP系統;及各種開放式資料庫系統,包含Oracle、DB2、Sybase、SQL server等;以及網際網路服務(HTTP)、JCA、Message Driven Bean、Java API、MQ Series、MSMQ和任何與JMS相容的訊息佇列(Message queue)。
四、 資料交換(Exchange):
新一代的ETL更可擔任企業和企業間的資料交換中心的角色,稱之為「B2Bi Hub」。為達成企業間資料無障礙的互相交換,ETL工具必須能支援以下協定:一、主要的電子資料交換架構,如X12 EDI、EDIFACT、FIX、SWIFT、HIPAA及其他類似架構。二、常用的應用系統及資料庫、業界的貿易標準協定及XML格式。三、可從一般的訊息佇列(Message Queue)、檔案夾佇列(File Folder Queue)及FTP佇列(FTP Queue)中「監聽」資料送達與否,並做即時處理。四、醫療軟體資料連接元件,包括HIPAA、HL7、及HCFA1500,以及UB-92連接元件。
很多擁有傳統主機系統的企業,其報表都以Spool的方式,暫存在主機的列印佇列當中,而這些Spool報表,對於資料倉儲及資料超市的系統發展者而言,正是不假外求且可立即擷取的寶貴資料,因此,ETL工具若能具備解譯「非結構化」資料的能力,順利的排除表頭表尾的格式限制,則可以大幅縮短主機系統資料外移所需要的程式撰寫的時間。
另外,服務導向架構(SOA)的風潮已經席捲軟體界,以ETL工具為例,上述的轉換套件及資料轉換功能,若能個別嵌入企業現有的應用系統中,將可增強系統掌控資料的能力;此外,ETL工具的定價若能夠配合SOA嵌入的政策,在價格上將更具有彈性,對企業而言則能大幅減低採購成本。
在現今應用範圍愈趨廣泛多元的情況下,ETL不論是在應用層面上或其他的應用系統的協同工作上,都有了很大的轉變,之前所慣見的ETL工具,已從資料倉儲專案裡的資料轉置平台,搖身一變成為企業內部各個應用系統之間溝通的管道,甚至進化成企業之間資訊交流的橋樑。
以上內容由捷冠資訊科技提供。http://www.firstbi.com.tw
洽詢專線:02-23581909

熱門新聞

Advertisement