AWS新服務大力擁抱AI，涵蓋機器學習、即時影片分析、自然語言處理、翻譯及AI攝影機

圖片來源:

Amazon

Amazon於本周三（11/29）展開的「Amazon Web Services re:Invent」雲端運算年度社群大會上發表了一系列的人工智慧（AI）服務及產品，從機器學習Amazon SageMaker、自然語言處理Amazon Comprehend、即時影片分析Amazon Rekognition Video、即時翻譯Amazon Translate、語音轉文字Amazon Transcribe，以及內建AI能力的視訊攝影機AWS DeepLens等。

創建大量機器學習Amazon SageMaker

其中，Amazon SageMaker是個端對端的機器學習服務，允許資料科學家、開發人員或機器學習專家能夠快速地建置、訓練與代管大規模的機器學習模型，它由3大元件組成，分別是可供創作的Jupyter notebook、分散式的模型訓練，以及模型代管。(來源：Amazon)

使用者可先建立notebook實例，利用AWS的演算法來追蹤訓練任務，建立模型，再將這些由AWS代管的模型部署於終端。

自然語言理解工具Amazon Comprehend

Amazon Comprehend為一自然語言處理服務，能夠分析98種語言並辨識這些語言所指稱的內容，像是人名、地點、品牌或產品等，也能理解語言中的關鍵句子與情緒，以於大量的文件或內容中依照主題加以建模或分類，該服務已於即日起上線。

大量影片內容管理的好幫手Amazon Rekognition Video

而Amazon Rekognition Video則為一影片分析服務，能夠用來分析儲存於S3上的大量影片，或是直播的串流影片。它與去年發表的Amazon Rekognition Image同樣都利用深度學習神經網路模型來分析內容，只不過一個分析的是圖像，一個則可分析即時影片。

Amazon Rekognition Video讓使用者可精確地偵測、追蹤、辨識與汲取影片中所出現的數千種物件或人臉，Amazon則強調它是全球首個可利用影片視覺、時間與動作脈絡來執行行為偵測與個人追蹤的影片分析服務，可提供更完整的影片解析能力，例如它能辨識影片中有個人、有輛車、有棵樹，並推斷那個人正往車輛跑去。

因此，未來不論是來自於手機、攝影機、IoT裝置或串流服務的影片都可藉由Amazon Rekognition Video來建立得以擴展且更精確的影片分析解決方案。

雲端的即時翻譯專家Amazon Translate

Amazon Translate為一即時的語言翻譯服務(下圖)，現為預覽版，它可併入其它的AWS服務，例如結合將文字轉換成語音的Amazon Polly服務來建立不同語言的應用，或是於Amazon S3中翻譯不同語言的文件，也能應用在AWS Elasticsearch中以不同語言進行搜尋，整合Amazon Lex以打造具備翻譯能力的聊天機器人，AWS Lambda用戶則能利用該服務來翻譯動態的網站內容。

此一翻譯服務將允許企業快速擴充產品及服務至不同的市場，或是轉換文件的語言，並汲取全球語言的資訊。

將語音轉為文字-Amazon Transcribe

至於Amazon Transcribe則是個自動語音辨識服務，能將語音轉換成文字，同時允許開發人員將此一功能嵌入應用程式中。

Amazon認為，全球有愈來愈多的資料是以影片或語音格式儲存，Amazon Transcribe允許企業將這些多媒體資料轉換成方便利用的文字，它支援WAV、MP3及Flac等不同的語音格式，可用來分析儲存於S3的語音檔案，或是分析客戶的通話資料、自動建立字幕、根據內容執行目標式廣告，也能搜尋語音或影片內容。

目前的Amazon Transcribe API預覽版可將英文或西班牙文的語音轉換成文字。

具備AI的視訊攝影機-AWS DeepLens

AWS DeepLens(下圖)是Amazon昨天發表的唯一一款硬體，它是個內建AI能力的視訊攝影機，搭載擁有100 GLOPS運算能力的Intel Atom處理器，400萬畫素的鏡頭可捕捉1080P的影片，並嵌有麥克風，每秒可執行數十張畫面，具備Wi-Fi、USB及micro HDMI傳輸埠，內建8GB的記憶體空間以供用戶預載模型與程式。

AWS DeepLens執行Ubuntu 16.04平台，也預載了Greengrass Core與MXNet。當中的Greengrass是個可將AWS雲端能力延伸到區域裝置的軟體，MXNet則為開源的深度學習框架，亦支援TensorFlow與Caffe2等其他框架。

開發人員除了可自行打造在AWS DeepLens上的應用程式之外，也能藉由AWS所提供的7種模型加強應用程式的能力(下圖)，涵蓋行動辨識模型、貓/狗辨識模型、人臉偵測模型及物件偵測模型等，AWS亦承諾會持續強化模型訓練，以創造更好的偵測與辨識能力。

AWS DeepLens可匯入於Amazon SageMaker中訓練的模型，還能藉由Amazon Kinesis Video Streams將影像串流回AWS，再利用Amazon Rekognition Video執行影像分析，同時也能連結其他的AWS服務。

AWS DeepLens即日起開放預購，售價為249美元，但得要等到明年4月才開始出貨。

AWS「Amazon Web Services re:Invent」影片YouTube頻道

熱門新聞