當前主要的公有雲廠商,都在持續發展人工智慧應用,並且提供對應的解決方案,而身為市場龍頭的AWS到了2017年底,也加緊腳步推出不同層面的平臺與服務,並強調整合多種AWS服務的優勢。

人工智慧的應用當道,使用機器學習技術的機會跟著快速增長,許多雲端服務業者都在積極發展這樣的業務,而AWS當然也不例外。

他們在底層架構的部份,提供搭配GPU的加速運算型執行個體P3,以及專門用於深度學習的一系列AMI映像檔,支援Apache MXNet、Caffe2、CNTK、PyTorch、TensorFlow、Theno、Torch等框架。而在深度學習的應用介面上,AWS也支援2015年問世的Keras(能在TensorFlow、CNTK、Theano當中執行),以及由AWS與微軟在2016年10月所共同推出的Gluon(MXNet已涵蓋在內,微軟CNTK未來版本及更多深度學習框架,也將納入)。

而在2017底年舉行的re:Invent全球用戶大會上,AWS新發表了多種機器學習相關的雲端服務項目。

推出機器學習整合服務,以及支援深度學習的視訊攝影機

在11月29日的主題演講當中,AWS執行長Andy Jassy針對機器學習平臺,首先宣布推出的服務是SageMaker,這是一套關於機器學習模型的建立、訓練與部署作業的雲端服務,由AWS全權管理,可協助應用程式的開發者、資料科學家,將發展機器學習環境所需的多項繁複操作,變得更容易。

SageMaker之所提供這樣的便利性,是因為運用了預先建好的Jupyter notebooks開發範本、針對PB等級資料集最佳化的常用機器學習演算法,以及自動模型調校等技術。而在訓練過程中,SageMaker也能予以簡化與加速,並且可以自動建立與管理所需要的IT基礎架構,用於訓練模型與執行推論,以便產生預測結果。

在深度學習框架的搭配上,SageMaker原生整合了TensorFlow和MXNet,未來將會支援更多類型,同時,開發者若在SageMaker使用特定的框架與演算法,也可以先把相關環境的容器,上傳到EC2 Container Registry容器登錄服務,再予以設定。

透過SageMaker執行訓練模型的過程,也相當簡單,開發者只需選擇EC2的執行個體類型與數量,以及資料所在位置即可,系統會幫你設定分散式運算叢集、執行模型的訓練,並將結果輸出到S3,在完成作業之後,也會自動拆散叢集。此外,這套服務提供了自動調校模型功能,裡面運用方式包括:超參數(Hyperparameters)的最佳化,以及自動調整幾千種演算法的參數組合,藉此提升預測精確度。

接續在SageMaker之後,Andy Jassy第二項關於機器學習的發布,出乎眾人意外地,竟是一臺具有WI-Fi無線上網能力、內建深度學習的視訊攝影機DeepLens,令全場與會者為之震驚。

這是一部協助開發者設計深度學習應用的設備,並可用於人員的教育訓練,AWS人工智慧事業群總經理Matt Wood也在現場利用這臺設備,直接向全場觀眾展示辨識物件圖像與臉部情緒的能力,處理速度與判斷準確性相當不錯。

Matt Wood也公布了DeepLens的售價是249美元,有意試用者,可參加re:Invent大會現場舉行的DeepLens工作坊,AWS也已經開放網站預購,可到電子商務網站amazon.com下單,預計在2018年初開始出貨。

AWS新服務降低機器學習門檻

想要獲得機器學習的能力,首先要克服的難關是相關環境的建置,而在AWS宣布推出的服務SageMaker當中,簡化了這些作業,開發者只需考慮資料模型該如何建立、訓練、部署,底層的瑣碎工作由AWS來處理。

提供更多類型的機器學習應用服務

除了SageMaker和DeepLens,AWS在圖像、語音、語言、語意的辨識服務上,也增加了新的解決方案。

在影像識別應用上,AWS先前就有Rekogntion,是針對圖片的搜尋、分析與組織,而在這次大會期間,他們推出Rekognition Video,能即時與批次分析影片,另一個則是Kinesis Video Streams,可擷取與儲存影音串流資料。

其中的Rekognition Video,可以針對用戶存放在S3雲端儲存的影片資料,追蹤裡面的人員與活動狀態,並且辨識物體、臉孔、名人與不當內容,AWS借助電腦視覺模型的力量,提供易於使用的API,而這些模型訓練的目的,就是為了能夠做到精準偵測幾千個物體與活動,並且可以針對即時錄製的視訊,以及放置在S3的影片,拆解出動作相關的脈絡。

而對於語音識別,AWS過去已推出文字轉換語音的服務Polly,以及針對應用程式提供語言和文字交談介面的服務Lex,而到了2017年底,他們增設了將語音辨識為文字的服務Transcribe,翻譯多國語文的Translate,以及具備自然語言處理能力的Comprehend。

以Transcribe為例,能夠處理音質較低的語音資料,例如通話中心的電話語音記錄,提供高精準度的分析,系統對於處理的每一個字,都會給予一個時戳(Timestamp),讓開發者對於文字與原始檔案的內容,進行精準對齊。而在多國語言的支援上,目前這套服務僅支援英文與西班牙文,至於處理其他語言的部份,未來將陸續推出。在技術的發展上,Transcribe的下個目標是針對同一個聲音檔,能夠清楚辨識出裡面的多個講者,也將提供開發者上傳自定的詞彙資料,以提升語音轉為文字的精確度。

而在Translate的服務當中,AWS運用了神經機器翻譯(Neural Machine Translation)的技術,提供精準的多國語文翻譯,初期可處理英文與6國語言之間的轉換(阿、法、德、葡、簡中、西),2018將推出更多語言的支援。

至於Comprehend,則是提供理解自然語言的能力,針對儲存在AWS雲端服務環境中的文件、社交網站的貼文、文章,以及任何文字資料,進行相關的處理。AWS在這套服務裡面,主要是運用了深度學習技術,而能辨識出多種資訊,例如:文字敘述的主體(例如人物、地點、日期、所屬的團體組織),內容撰寫採用的語言,文字表達的情緒、表達概念與形容詞的關鍵字。

AWS物聯網雲端服務的新布局

在2017年底,AWS宣布6個物聯網(IoT)雲端服務,都是針對連網設備而來的應用。首先發表的是IoT 1-Click,提供更易於建構物聯網應用的環境,針對使用者單鍵操作的連網設備,使其具有技術支援、後續添購相關商品與服務,或是資產位置追蹤等功能。

接著,AWS推出IoT Device Management、IoT Device Defender、IoT Analytics,對應連網設備的管理、安全防護,以及資料分析需求。

而對於小型、低功耗連網設備的整合運用,AWS提供Amazon FreeRTOS作業系統平臺,使設備安全連至AWS雲端服務,或是執行Greengrass的邊緣設備與閘道裝置,而開發者可以更容易建構具有通用物聯網能力的設備。


Advertisement

更多 iThome相關內容