Teradata也跟進加入了激烈的AI技術競賽,推出自家的深度學習框架ThinkDeep,結合多種開源數據技術,包含R語言、深度學習框架Tensorflow、Spark大數據平臺等,涵蓋了整個資料分析生命周期,包含機器學習的模型建置、測試、部署和管理。

圖片來源: 

iThome

老牌資料倉儲龍頭Teradata於5月18日舉辦2017 Teradata上海大數據峰會,「過去一年是我們轉變最大的一年!」Teradata國際集團執行副總裁Peter Mikkelsen一開頭就這樣說道,在過去的一年,人工智慧技術崛起和開源工具盛行,也對傳統的大數據倉儲公司產生衝擊,因此,Teradata喊出「Teradata Everywhere」的口號,不僅積極擁抱開源,整合了多方開源大數據分析工具,還提出自家的深度學習框架ThinkDeep。

許多軟體大廠都有自家的優先策略,像是Google喊出AI First,微軟則是Cloud First,Peter Mikkelsen表示,Teradata則是Customer First,雖然這樣的口號非常老套,不過,他表示,這是真真實實的策略,整合開源環境和採用AI技術,來自客戶提出的需求。

他觀察,開源工具在數據分析領域會變得越來越重要,不只將開源工具整合到Teradata商用數據分析平臺,還要提供管理數據分析的統一平臺,做到「開源工具隱形化」,Peter Mikkelsen表示,來降低企業要使用開源工具的複雜度,省去部署和轉移資料的過程,讓開源的優勢可以保留,同時又可以皆兼顧數據管理的能力。另外,Teradata也提供企業諮詢的服務,輔導企業找出最適合自家的數據分析工具。他補充,Teradata不是只從開源的社群拿取資源,先前還開源釋出了資料湖管理工具Kylo。

另一方面,Teradata也跟進加入了激烈的AI技術競賽,推出自家的深度學習框架ThinkDeep,結合多種開源數據技術,包含R語言、深度學習框架Tensorflow、Spark大數據平臺等,要成為連那些不是資料科學家的使用者或開發者,都能運用的深度學習框架,涵蓋了整個資料分析生命周期,包含機器學習的模型建置、測試、部署和管理。

Teradata首席技術長Stephen Brobst指出,深度學習框架ThinkDeep有自動學習的能力,可以根據最新加入的數據,自動更新分析模型,也提供部署模型,讓企業能夠自動化部署深度學框架,另外,也簡化了分析模型的建置過程,提供企業依據不同的問題,創造多個分析模型。

不過,Stephen Brobst表示,AI越來越像行銷的用語,所有尚未解決的問題,企業都把解決方案導向AI,其實,企業應該要了解什麼樣的問題適合用什麼技術去解決,才能發揮最大的效益。

他進一步指出,機器學習和深度學習適用目的有很大的不同,機器學習能夠解決一般大部分問題,且能提供企業看到每個流程的決策,而深度學習則適合解決複雜度較高的問題,像是數據不完整的情況或是高維度資料架構的情況,比較適合用深度學習演算法,不過,由於深度學習分析過程經歷許多神經網路的隱藏層,不能看見每一層參數決策的過程,若企業需要了解資料輸入與輸出的關係,就比較不適合採用。

除了技術層面,Teradata產品及解決方案行銷副總裁Chris Twogood則發表了2項企業級功能,包含數據環境轉移機制和顧客歷程分析可視化的解決方案。數據環境轉移機制透過Teradata的跨混合雲機制,企業不用將數據綁死在同一個環境,可以在本地端、Teradata的雲端IntelliCloud、公有雲和企業的私有雲中轉換環境。

而顧客歷程分析可視化機制上,Chris Twogood表示,有許多企業開始分析客戶歷程數據,舉例來說,一個客戶想買房子到房屋估價網和貸款網站查看資訊,金融業者就可以得知客戶要買房子,能在其他管道推播房貸的資訊,若客戶申辦程序只做到一半沒有完成就離開,企業想要即時分析客戶離開的原因,進而改善服務,Teradata除了提供企業客戶路徑分析、可視化溝通流程、模擬即時促銷等功能,還可供企業導入第三方或內部的銷售評分模型。

在未來發展策略上,大中華區首席執行長辛兒倫表示,Teradata有三大戰略,第一,提供更多元化的數據分析能力,也就是包容目前既有的開源技術,將好的技術整合到Teradata的解決方案中,並且要求分析過程必須快速、敏捷。第二,Teradata也要培養專業的人員,歸納出有效的分析方法,並充分地與企業討論如何運用數據提升業務;第三則是要提供企業更創新的客製化應用,評估新興的技術並為企業打造符合企業應用場景的服務。

大家都很好奇到底哪一個產業最需要數據分析的能力?Peter Mikkelsen認為,數據分析已深植在每個產業中,但他預言,IoT將會開始影響所有的產業,由於目前IoT和感測器的產品眾多,未來,每個企業都會需要分析IoT所收集的數據。而辛兒倫則補充,近幾年許多產業都開始打造「客戶生活周期管理」系統,包含金融業、航空業和零售業等,都從過去客戶的生命周期管理轉移到生活,意味著企業更積極地與客戶互動,企圖在第一時間產生即時的互動,不但可以提升客戶體驗,還可以增加新的銷售管道,因此,他認為,數據分析是數位行銷的關鍵,企業能夠透過數據分析的技術,掌握客戶過去和未來的需求,創造新的互動模式。

全球Top4技術長

 企業擁抱AI還有2大難題 

曾列為全球第4名的Teradata技術長Stephen Brobst認為,深度學習演算法大約就像8歲的小孩,要一直不斷地給他資訊,從錯誤中不斷學習,才能慢慢的歸納出一套法則。

面對近來AI技術的崛起,曾列為全球第4名的Teradata技術長Stephen Brobst認為,機器學習和深度學習在企業中的應用都還在很初期的階段,許多企業高喊用AI技術,但其實,真正在數據分析的領域運用到AI技術的少之又少。

市場上AI技術如此火熱,為什麼真正採用的企業卻不多?他認為,目前的AI技術還有兩大問題尚未解決,第一,企業的資料科學家需要知道數據分析過程中,每個決策的原因,他將深度學習演算法比喻成黑盒子,資料科學家就是要透過數據分析,了解數據的前因後果,但深度學習的隱藏層則埋沒了這些重要資訊,甚至,每次執行演算法所產生的隱藏層數量也不一樣,讓企業無法得到數據的洞察(Insight),他也補充,目前有許多頂尖的科學家正在開發可以看見每一層決策的類神經網路,若能解決這項問題,將會是企業能夠採用深度學習的關鍵之一。

第二則是AI的技術中,不管是機器學習或是深度學習都需要非常大量的資料,但大部分的企業資料量是不足的,導致企業採用深度學習演算法的效果不彰,他比喻,深度學習演算法大約就像8歲的小孩,要一直不斷地給他資訊,從錯誤中不斷學習,才能慢慢的歸納出一套法則。

提到AI技術,許多雲端大廠紛紛推出自家的服務,但是都得在雲端上運行,AI技術的熱潮是否也意味著企業將資料上雲端是未來必然的趨勢?依照Stephen Brobst的觀察,其實不然,根據統計,「目前只有低於3分之1的企業將資料放到公有雲,」大部分的企業因為有安全上的疑慮,多半將資料放在本地端或是私有雲,他坦言,並不是所有的企業都適合用雲端的服務,許多企業認為雲端比較便宜,其實若是大規模的企業,擁有大量的數據,將資料上雲端是十分昂貴的,但是,若資料量小,放上雲端確實相對便宜。

雖然Stephen Brobst身為大數據倉儲公司的技術長,他表示,他從來就不喜歡大數據這個用語,大數據就只是數據的一種,目前,數據已經不是只看量多大,而是要去研究如何分析多元結構的數據,由於目前許多數據來自不同的通道,像是網站的點擊紀錄、圖片、影音等,包含了結構化、半結構化和非結構化的數據,甚至,還要結合政府的開放資料,例如天氣、交通等數據,若企業要能將這些多元的數據,妥善的分析應用,是需要結合許多不同的方法和平臺,這也是目前數據分析最具挑戰的工作。


Advertisement

更多 iThome相關內容