由Amazon發起,在去年跟微軟、Salesforce、百度等多家廠商,一起推出的人工智慧語音相容計畫(Voice Interoperability Initiative),透過制定規範使裝置可支援多個語音服務,現在這項計畫的成員陣容越來越壯大,加入了臉書、杜比(Dolby)、Garmin和小米等廠商,目前成員數量已經超過70名。另外,Amazon還收集計畫成員的建議和最佳做法,發布了第1版多代理設計指南(Multi-Agent Design Guide)。

人工智慧語音相容計畫的目的,是要在單個裝置上,同時支援多個語音代理,讓用戶擁有更靈活的選擇,其主要有4個優先準則,首先是讓語音裝置能夠接受多個喚醒詞;而且必須在保護用戶隱私安全的前提下,與其他語音助理能無縫協作;透過遵守共同的標準,讓製造商在同一個裝置上更容易整合多個語音代理;還有藉由成員間的合作,加速機器學習和對話人工智慧的研究,改善語音服務的品質與互通性。

過去一整年有臉書、杜比(Dolby)、Garmin和小米等38個新成員加入人工智慧語音相容計畫,成員總數達到了77個,其中包括消費電子、汽車製造、電信、硬體製造和系統整合等各領域廠商,臉書提到,在視訊裝置Portal上內建語音助理Alexa,讓用戶得以控制智慧家庭裝置和使用Skills,不只Portal能夠提供更多功能,還能提升用戶的使用體驗。

另外,Amazon還發布了第1版多代理設計指南,其提供多個語音代理裝置的建議和最佳做法。該指南收集許多裝置製造商,生產支援多語音代理產品的設計建議,內容總共涵蓋3個領域,分別是用戶選擇與代理啟用、多代理體驗,還有隱私與安全。

Amazon提到,客戶選擇是人工智慧語音相容計畫的基石,該指南建議在裝置上註冊多個代理,並且接受用戶使用多個喚醒詞,選擇啟用對應的代理,而多代理體驗的部分,則是說明代理可用來增加用戶參與的基本行為,使用戶能夠找到可用代理,並且順利探索功能。

多代理設計指南還包含了代理轉移的通用命令建議,當第一個代理無法解決用戶的請求,可以透過互通性模式,在不共用資料和上下文的情況下,召喚另一個代理出來協助用戶。該指南也介紹了取得用戶信任的一些基本要件,協助廠商能夠建構透明、可預測且符合期望行為與體驗的語音裝置,指南建議裝置應該至少需要擁有3個核心注意力狀態,分別處理聽、思考和說,讓用戶能夠掌握語音助理的活動狀態,以及狀態改變。

熱門新聞

Advertisement