圖片來源: 

Amazon

Amazon於本周三(11/29)展開的「Amazon Web Services re:Invent」雲端運算年度社群大會上發表了一系列的人工智慧(AI)服務及產品,從機器學習Amazon SageMaker自然語言處理Amazon Comprehend即時影片分析Amazon Rekognition Video即時翻譯Amazon Translate語音轉文字Amazon Transcribe,以及內建AI能力的視訊攝影機AWS DeepLens等。

 

創建大量機器學習Amazon SageMaker

其中,Amazon SageMaker是個端對端的機器學習服務,允許資料科學家、開發人員或機器學習專家能夠快速地建置、訓練與代管大規模的機器學習模型,它由3大元件組成,分別是可供創作的Jupyter notebook、分散式的模型訓練,以及模型代管。(來源:Amazon)

使用者可先建立notebook實例,利用AWS的演算法來追蹤訓練任務,建立模型,再將這些由AWS代管的模型部署於終端。

 

自然語言理解工具Amazon Comprehend

Amazon Comprehend為一自然語言處理服務,能夠分析98種語言並辨識這些語言所指稱的內容,像是人名、地點、品牌或產品等,也能理解語言中的關鍵句子與情緒,以於大量的文件或內容中依照主題加以建模或分類,該服務已於即日起上線。

 

大量影片內容管理的好幫手Amazon Rekognition Video

而Amazon Rekognition Video則為一影片分析服務,能夠用來分析儲存於S3上的大量影片,或是直播的串流影片。它與去年發表的Amazon Rekognition Image同樣都利用深度學習神經網路模型來分析內容,只不過一個分析的是圖像,一個則可分析即時影片。

Amazon Rekognition Video讓使用者可精確地偵測、追蹤、辨識與汲取影片中所出現的數千種物件或人臉,Amazon則強調它是全球首個可利用影片視覺、時間與動作脈絡來執行行為偵測與個人追蹤的影片分析服務,可提供更完整的影片解析能力,例如它能辨識影片中有個人、有輛車、有棵樹,並推斷那個人正往車輛跑去。

因此,未來不論是來自於手機、攝影機、IoT裝置或串流服務的影片都可藉由Amazon Rekognition Video來建立得以擴展且更精確的影片分析解決方案。

 

雲端的即時翻譯專家Amazon Translate

Amazon Translate為一即時的語言翻譯服務(下圖),現為預覽版,它可併入其它的AWS服務,例如結合將文字轉換成語音的Amazon Polly服務來建立不同語言的應用,或是於Amazon S3中翻譯不同語言的文件,也能應用在AWS Elasticsearch中以不同語言進行搜尋,整合Amazon Lex以打造具備翻譯能力的聊天機器人,AWS Lambda用戶則能利用該服務來翻譯動態的網站內容。

此一翻譯服務將允許企業快速擴充產品及服務至不同的市場,或是轉換文件的語言,並汲取全球語言的資訊。

 

將語音轉為文字-Amazon Transcribe

至於Amazon Transcribe則是個自動語音辨識服務,能將語音轉換成文字,同時允許開發人員將此一功能嵌入應用程式中。

Amazon認為,全球有愈來愈多的資料是以影片或語音格式儲存,Amazon Transcribe允許企業將這些多媒體資料轉換成方便利用的文字,它支援WAV、MP3及Flac等不同的語音格式,可用來分析儲存於S3的語音檔案,或是分析客戶的通話資料、自動建立字幕、根據內容執行目標式廣告,也能搜尋語音或影片內容。

目前的Amazon Transcribe API預覽版可將英文或西班牙文的語音轉換成文字。

 

具備AI的視訊攝影機-AWS DeepLens

AWS DeepLens(下圖)是Amazon昨天發表的唯一一款硬體,它是個內建AI能力的視訊攝影機,搭載擁有100 GLOPS運算能力的Intel Atom處理器,400萬畫素的鏡頭可捕捉1080P的影片,並嵌有麥克風,每秒可執行數十張畫面,具備Wi-Fi、USB及micro HDMI傳輸埠,內建8GB的記憶體空間以供用戶預載模型與程式。

AWS DeepLens執行Ubuntu 16.04平台,也預載了Greengrass Core與MXNet。當中的Greengrass是個可將AWS雲端能力延伸到區域裝置的軟體,MXNet則為開源的深度學習框架,亦支援TensorFlow與Caffe2等其他框架。

開發人員除了可自行打造在AWS DeepLens上的應用程式之外,也能藉由AWS所提供的7種模型加強應用程式的能力(下圖),涵蓋行動辨識模型、貓/狗辨識模型、人臉偵測模型及物件偵測模型等,AWS亦承諾會持續強化模型訓練,以創造更好的偵測與辨識能力。

AWS DeepLens可匯入於Amazon SageMaker中訓練的模型,還能藉由Amazon Kinesis Video Streams將影像串流回AWS,再利用Amazon Rekognition Video執行影像分析,同時也能連結其他的AWS服務。

AWS DeepLens即日起開放預購,售價為249美元,但得要等到明年4月才開始出貨。

 

AWS「Amazon Web Services re:Invent」影片YouTube頻道


Advertisement

更多 iThome相關內容