圖片來源: 

Google

重點新聞(0415~0428)

Google Home利用類神經網路技術辨識用戶「聲」分

Google近日更新Google Home APP,以讓它能辨識不同用戶的聲音,提供個人化服務,一臺Google Home最多可同時支援6名用戶。Google Assistant產品經理Yury Pinsky說明,在開啟Google Home程式並選擇Google Home裝置後,就可在裝置上連結自己的帳號,之後Google Assistant即會要求用戶重覆唸出Ok Google與Hey Google,透過類神經網路演算法分析,系統即可辨識使用者的聲音特性,作為辨識不同用戶身分的依據。

因此,未來當其中一名用戶啟用Google Home之後,它即可根據其身分提供相對應的個人化服務,像是音樂播放清單、通勤時間或行事曆等。其實Amazon Echo同樣也能支援多名用戶,只不過它必須由使用者明確要求Alexa切換至不同用戶,而非如同Google Home可從聲音自動辨識使用者身分。此一新的Google Home功能將率先部署於美國市場,預計數月後會延伸至英國市場。

Google雲端語音辨識服務上線!連中文也能轉為文字

日前,Google推出旗下雲端語音辨識API(Cloud Speech API)正式版(GA),Google雲端語音辨識服務能夠即時辨識80種以上的語言,轉換成文字,連正體中文也可以辨識。Google在2016年夏天釋出雲端語音辨識API公開測試版,現在終於推出正式版,提供雲端開發人員使用。

而雲端語音辨識API採用與Google Now、Google搜尋及Google Assistant相同的語音辨識技術,根據Google,雲端語音辨識API是幾款預先訓練機器學習模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來執行如影像分析、圖像分析、文字分析和動態翻譯等常見的任務。在正式版的雲端語音辨識API,Google加強了長度較長的音訊檔案轉錄精準度,以及新增支援WAV、Opus和Speex檔案格式。Google也聲稱,新版語音辨識API比舊版的批次處理速度快3倍。

另外,目前已有廠商採用Google雲端語音辨識API,根據Google官網,美國德州的電話語音SaaS開發商InteractiveTel採用Google雲端語音辨識服務,透過即時的語音轉文字,來分析業者與顧客在電話中的互動,以協助業者提升銷售業績。

AWS終於釋出數位個人助理Alexa的後端引擎Lex

AWS近日釋出了數位語音助理Alexa的後端引擎Amazon Lex,將此服務整合於AWS Lambda中,提供使用者打造自己的對話機器人,可將對話機器人部署到聊天平臺、行動用戶端,甚至是IoT裝置,並提供管理介面,讓使用者建立、部署和追蹤對話機器人的狀況。

AWS表示,迄今只有極少數的開發人員打造及部署具備自動語音辨識(ARS)及自然語言理解(NLU)能力的應用程式,因為這需要大量資料與架構來進行複雜的深度演算法訓練,Lex解決了這個門檻,讓開發人員以支撐Alexa的ARS與NLU技術來打造能以自然語言溝通的應用程式。

Lex的應用範圍比Alexa Skills Kit大上許多。Alexa Skills Kit允許開發人員利用所有的Alexa功能,但侷限於Alexa裝置與生態體系;Amazon Lex主要是供企業打造客製化的聊天機器人,且它同時支援語音與文字的自然語言溝通,還可部署到各種平臺上。

Lex是根據機器人所處理的文字或語音請求的數量來計費,1,000個語音請求的費用為4美元,1,000個文字請求的費用為0.75美元。它現在仍為預覽版,只在美國東部的AWS區域提供。

臉書開源釋出深度學習框架Caffe2,行動裝置也能直接執行AI應用

臉書日前在F8大會上發布了輕量級且模組化的深度學習框架Caffe2,相較於原版Caffe框架,Caffe2更具彈性且效能更好。同時,Caffe2也是臉書推出的第一個能在正式環境中部署的版本,目前,臉書已在GitHub上釋出Caffe2的開放原始碼。

根據臉書表示,Caffe2框架可以部署至iOS、Android和Raspberry Pi裝置,也就是說,行動裝置的使用者將能直接從行動裝置上取得圖像辨識、自然語言處理和電腦視覺等功能,而過去這些功能得透過雲端連結遠端伺服器才能取得。

Caffe2不只是一個人工智慧程式框架,更是能在行動裝置上執行AI的工具,允許行動裝置能夠直接辨識圖像、影像、文字和語音。另外,Caffe2支援Python和C++ API,以及整合Visual Studio、Android Studio和XCode開發環境,提供開發者開發行動App。

開發者也可以利用模型動物園(Model Zoo)中,由開發者社群提供的預先訓練模型(Pre-Trained Model)來快速打造自己的AI應用,如聊天機器人、物聯網、翻譯、語音辨識等應用,或是改進Model Zoo裡的模型,再發布一套新的機器學習模型。

除此之外,臉書也表示,該團隊與Nvidia、高通、英特爾、亞馬遜和微軟合作,來優化Caffe2在雲端和行動裝置環境的效能,且透過這樣的合作,將加速機器學習社群能嘗試使用更複雜的機器學習模型,並部署新一代人工智慧App和服務。

個人數位健身教練來了!為你打造專屬的運動課程

美國一家新創LifeBeam近日推出一款運動耳機Vi,內建數位個人健身教練,能定位使用者的位置,提供天氣的資訊,也能根據使用者的運動狀態,提供量身打造的運動模式,並隨時條整,全程與使用者用語音的方式交談,就像真人教練一樣。

Vi記錄使用者運動的節奏、消耗的熱量和慢跑的速度、距離、腳步等數據,並即時提供健身的建議,舉例來說,若使用者問Vi我的狀態如何?Vi會根據使用者的狀況,指導使用者運動的節奏。LifeBeam設計Vi時錄製了數十萬的真人錄音檔,讓Vi說話時更像真人,且藉由機器學習的技術,Vi能夠不只是重複說出既定的句子,Vi甚至會問使用者有沒有把名字唸錯。目前,Vi可以與第三方的APP連接,包含Google Fit、Apple HealthKit和Strava等。

IBM Watson推出企業行銷分析新工具

IBM近日公開了Watson一項新工具行銷洞察(Watson Marketing Insights),利用人工智慧的技術,提供企業能運用現有的數據,創造出價值。Marketing Insights可以分析消費者和企業多元的銷售管道的互動狀況,以電子商務為例,Marketing Insights能夠記錄消費者未購買商品的過程,透過演算法找到消費者沒有購買的動作,進而改善行銷策略。

IBM表示,企業更換商品和銷售策略,也會影響分析的結果,因此,Marketing Insights會自動分析最新的消費者互動狀況。未來,IBM也將推出能夠分析影片的工具,透過電腦視覺等技術,自動將影片分成多個場景的方式,再找到影片中重要的資訊,可以減少人工處理的時間,預計今年之前會推出。整理⊙何維涓

AI趨勢近期新聞

※F8:企業版臉書Workplace新增機器人功能,整合Box與微軟等企業服務

※F8: Facebook Messenger要成為通訊平臺上的黃頁

※蜘蛛人推出Chatbot,Marvel故事說給你聽

※繼Outlook和Office 365之後,Alexa也能支援G Suite行事曆

資料來源:iThome整理,2017年4月。


Advertisement

更多 iThome相關內容