臉書、杜比和Garmin都加入Amazon為首的AI語音相容計畫

由Amazon發起，在去年跟微軟、Salesforce、百度等多家廠商，一起推出的人工智慧語音相容計畫（Voice Interoperability Initiative），透過制定規範使裝置可支援多個語音服務，現在這項計畫的成員陣容越來越壯大，加入了臉書、杜比（Dolby）、Garmin和小米等廠商，目前成員數量已經超過70名。另外，Amazon還收集計畫成員的建議和最佳做法，發布了第1版多代理設計指南（Multi-Agent Design Guide）。

人工智慧語音相容計畫的目的，是要在單個裝置上，同時支援多個語音代理，讓用戶擁有更靈活的選擇，其主要有4個優先準則，首先是讓語音裝置能夠接受多個喚醒詞；而且必須在保護用戶隱私安全的前提下，與其他語音助理能無縫協作；透過遵守共同的標準，讓製造商在同一個裝置上更容易整合多個語音代理；還有藉由成員間的合作，加速機器學習和對話人工智慧的研究，改善語音服務的品質與互通性。

過去一整年有臉書、杜比（Dolby）、Garmin和小米等38個新成員加入人工智慧語音相容計畫，成員總數達到了77個，其中包括消費電子、汽車製造、電信、硬體製造和系統整合等各領域廠商，臉書提到，在視訊裝置Portal上內建語音助理Alexa，讓用戶得以控制智慧家庭裝置和使用Skills，不只Portal能夠提供更多功能，還能提升用戶的使用體驗。

另外，Amazon還發布了第1版多代理設計指南，其提供多個語音代理裝置的建議和最佳做法。該指南收集許多裝置製造商，生產支援多語音代理產品的設計建議，內容總共涵蓋3個領域，分別是用戶選擇與代理啟用、多代理體驗，還有隱私與安全。

Amazon提到，客戶選擇是人工智慧語音相容計畫的基石，該指南建議在裝置上註冊多個代理，並且接受用戶使用多個喚醒詞，選擇啟用對應的代理，而多代理體驗的部分，則是說明代理可用來增加用戶參與的基本行為，使用戶能夠找到可用代理，並且順利探索功能。

多代理設計指南還包含了代理轉移的通用命令建議，當第一個代理無法解決用戶的請求，可以透過互通性模式，在不共用資料和上下文的情況下，召喚另一個代理出來協助用戶。該指南也介紹了取得用戶信任的一些基本要件，協助廠商能夠建構透明、可預測且符合期望行為與體驗的語音裝置，指南建議裝置應該至少需要擁有3個核心注意力狀態，分別處理聽、思考和說，讓用戶能夠掌握語音助理的活動狀態，以及狀態改變。

熱門新聞