2020年,AI依然是個關鍵字,但不同的是,實現各種AI應用背後的關鍵模型,其開發和訓練門檻變得更低、支援的類型將更廣,甚至不懂程式開發的領域專家,都能自己動手快速建立ML模型。關鍵就是,去年Google發表的AutoML機器學習自動化服務類型,現在成了各大主流公雲的標準配備,連雲端龍頭AWS在2019年12月剛推出的AI整合開發工具Amazon SageMaker Studio中,都主打機器學習自動化功能AutoPilot,只要上傳表格型資料,就能自動建立可用的機器學習預測模型。
AutoML從先前的少數獨有,到現在變成了主流機器學習服務的標準配備,也大多朝向網頁化介面、免程式開發特性、工作流程視覺化管理的共同趨勢發展,可說是進入新的AutoML 2.0階段。
這意味著,更多分析人力不足的中小型企業能夠受惠。IBM在2019年初的報告指出,一家企業光是優化、管理機器學習模型,就需要1至6名資料科學家。而爆發式的AutoML 2.0產品,讓這些缺乏人才的中小型企業,也能自己打造客製化的機器學習模型,提供更貼近產業特性的應用。
回顧過去,2018年,雲端巨頭以自家豐厚的雲端資源,相繼推出低門檻的模型自動化開發與訓練服務。最典型的例子,就是年初最先登場的Google Cloud AutoML,一次瞄準影像辨識(Vision)、翻譯(Translation)和自然語言(Natural Language)等三大領域,支援CNN、RNN和LSTM三種演算法,讓企業能用自己的資料,來打造客製化AI模型。
進一步來說,Google Cloud AutoML的特別之處,在於能自動挑選演算法、調整超參數,透過不斷優化找出最合適的模型。另一主打特色,是不用撰寫程式碼,或簡稱No Code(免程式碼),透過配置檔或參數設定,上傳訓練用的資料,就可開始進行模型訓練。以影像辨識為例,使用者只要上傳數十或數百張照片,就能訓練出專屬的AI模型,大幅降低AI開發門檻。Cloud AutoML的影像辨識、翻譯和自然語言服務,隨後也在隔年11、12月正式上線。
Google Cloud AutoML的特色,成為自動化機器學習服務的藍本。2018年底,微軟也在Azure Machine Learning中,正式推出自動化機器學習服務(Automated ML),支援迴歸、分類和預測等演算法,其中一些功能也在2019年正式上線。這項服務,雖然僅支援結構化資料作為訓練資料,但仍是企業無程式碼機器學習服務的另一選擇。
更多大廠投入,AutoML遍地開花
自此,更多大廠爭相加入AutoML戰局,紛紛跨出第一步,發表簡易、自動化程度更高的機器學習開發服務。
IBM就是其中之一。比如,2019年第二季時,IBM在自家機器學習服務Watson Studio中,正式推出可自動調校模型的無程式碼機器學習功能AutoAI,提供自動化資料預處理、特徵工程,以及超參數調整等功能。不過,相較於Google Cloud AutoML,AutoAI只支援迴歸和分類演算法,在資料類型上,也僅支援結構化資料的CSV格式,檔案大小限制為100MB。
另一方面,數據分析龍頭SAS也加入AutoML戰局。2019年第四季,SAS宣布在自家雲端開發環境平臺Viya中,正式新增自動化機器學習功能。同樣主打簡易操作,新功能可自動執行資料整理、特徵工程,以及演算法挑選等流程,並支援分類和回歸演算法。
這股AutoML風潮,也吹進由Apache Spark技術團隊創辦的資料科學公司Databricks,2019年8月,正式在自家整合分析平臺中,推出自動化機器學習工具套件(AutoML Toolkit),支援迴歸與分類演算法,可自動處理特徵工程、調校超參數、模型搜尋,以及模型部署。有趣的是,它同時也提供細緻的控制功能,讓資料科學家可手動微調。
採取類似作法的,還有雲端龍頭AWS,瞄準企業資料科學家和沒受過機器學習訓練的業務,於2019年底,在機器學習整合開發環境Amazon SageMaker Studio中,新添自動化機器學習功能AutoPilot,除了自動進行模型訓練,還會產生Python程式碼,來告訴使用者AutoPilot如何預處理資料;對資料科學家來說,可作為日後手動修改的參考。
AI模型開發成工廠作業,2020年迎來應用大爆發
自Google發表Cloud AutoML以來,開啟了AutoML百家爭鳴的時代, ML門檻一再降低,連沒有資料科學團隊的企業,都可快速訓練模型、開發AI應用,使AI模型開發成為工廠作業,可快速大量訓練和客製化生產。不論何種產業,都更容易發展各自的產業AI應用,2020年將帶來另一波企業AI應用的大爆發。
熱門新聞
2024-10-05
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07