Taiwan AI Lab創辦人杜奕瑾(左)與兩廳院藝術總監劉怡汝(右)合影,劉怡汝表示,要讓科技和藝術不再是兩條平行線,透過與雅婷逐字稿的合作跨出第一步。

圖片來源: 

攝影/翁芊儒

兩廳院與台灣人工智慧實驗室(Taiwan AI Lab)合作,引進後者「雅婷逐字稿」系統的AI語音辨識技術,讓表演前導聆活動或周邊活動,都能提供即時字幕輔助,讓聽障人士更能參與藝文表演。兩廳院藝術總監劉怡汝表示,「雅婷逐字稿不再是一種工具的想像,而是藝術走向科技,或是科技擁抱藝術的展現。」這是兩廳院實現藝術平權的其中一環。

雅婷逐字稿是由台灣人工智慧實驗室研發的語音辨識系統,運用語音轉文字(ASR)、以及自然語言處理(NLP)的技術來開發,其中,由於用來訓練模型的資料,大量採用批踢踢的鄉民語彙,以及g0v零時政府、電視台、Youtube等公開的臺灣在地資料,因此,雅婷逐字稿不僅能熟悉臺灣民眾的網路新創語彙,連臺灣國語腔調都能支援,且自2018年11月推出以來,就被廣泛應用在訪談、會議紀錄等場合。

Taiwan AI Lab創辦人杜奕瑾表示,雅婷逐字稿在一般對話的場景中,準確率可達9成,但在開放場域準確率就會下滑,原因是手機App在網路不延遲的情況下,即時收音並轉譯的效果較佳,但如果在兩廳院等開放場域,就取決於收音環境中人與麥克風的距離、是否有回音干擾,以及語料中的專業詞彙夠不夠多等問題。

因此,兩廳院也從去年底積極與Taiwan AI Lab接洽,運用未公開的網頁版進行測試,事先將節目內容、講座文稿、藝術專用字典等資料匯入雅婷逐字稿,也透過講座現場的對話討論內容,來增進藝術領域中專業字彙的辨識能力。杜奕瑾表示,ASR又分為語言模型(Language Model)和聲音模型(Acoustic Model),語言模型可以透過文字來優化,聲音模型則是要透過不斷使用雅婷逐字稿的過程,增加語音資料量,準確度才會提升。目前由兩廳院實際評測的結果,準確度可達8成5。

兩廳院與雅婷逐字稿的合作計畫,第一階段將先用在演前導聆,未來則希望擴大應用於導覽、演後座談以及推廣工作坊,劉怡汝表示,近年來,兩廳院積極提升無障礙服務,在常態節目中規劃口述影像、即時聽打服務,但人力打字有其速度的侷限,實際執行時也受限於場地、難以更近一步推廣。因此,才希望透過科技結合藝術,創造共融場域,提供更多元的藝文參與方式。


Advertisement

更多 iThome相關內容