雅婷逐字稿要幫兩廳院藝文活動即時上字幕，讓聽障者能更享受表演

Taiwan AI Lab創辦人杜奕瑾（左）與兩廳院藝術總監劉怡汝（右）合影，劉怡汝表示，要讓科技和藝術不再是兩條平行線，透過與雅婷逐字稿的合作跨出第一步。

圖片來源:

攝影/翁芊儒

兩廳院與台灣人工智慧實驗室（Taiwan AI Lab）合作，引進後者「雅婷逐字稿」系統的AI語音辨識技術，讓表演前導聆活動或周邊活動，都能提供即時字幕輔助，讓聽障人士更能參與藝文表演。兩廳院藝術總監劉怡汝表示，「雅婷逐字稿不再是一種工具的想像，而是藝術走向科技，或是科技擁抱藝術的展現。」這是兩廳院實現藝術平權的其中一環。

雅婷逐字稿是由台灣人工智慧實驗室研發的語音辨識系統，運用語音轉文字（ASR）、以及自然語言處理（NLP）的技術來開發，其中，由於用來訓練模型的資料，大量採用批踢踢的鄉民語彙，以及g0v零時政府、電視台、Youtube等公開的臺灣在地資料，因此，雅婷逐字稿不僅能熟悉臺灣民眾的網路新創語彙，連臺灣國語腔調都能支援，且自2018年11月推出以來，就被廣泛應用在訪談、會議紀錄等場合。

Taiwan AI Lab創辦人杜奕瑾表示，雅婷逐字稿在一般對話的場景中，準確率可達9成，但在開放場域準確率就會下滑，原因是手機App在網路不延遲的情況下，即時收音並轉譯的效果較佳，但如果在兩廳院等開放場域，就取決於收音環境中人與麥克風的距離、是否有回音干擾，以及語料中的專業詞彙夠不夠多等問題。

因此，兩廳院也從去年底積極與Taiwan AI Lab接洽，運用未公開的網頁版進行測試，事先將節目內容、講座文稿、藝術專用字典等資料匯入雅婷逐字稿，也透過講座現場的對話討論內容，來增進藝術領域中專業字彙的辨識能力。杜奕瑾表示，ASR又分為語言模型（Language Model）和聲音模型（Acoustic Model），語言模型可以透過文字來優化，聲音模型則是要透過不斷使用雅婷逐字稿的過程，增加語音資料量，準確度才會提升。目前由兩廳院實際評測的結果，準確度可達8成5。

兩廳院與雅婷逐字稿的合作計畫，第一階段將先用在演前導聆，未來則希望擴大應用於導覽、演後座談以及推廣工作坊，劉怡汝表示，近年來，兩廳院積極提升無障礙服務，在常態節目中規劃口述影像、即時聽打服務，但人力打字有其速度的侷限，實際執行時也受限於場地、難以更近一步推廣。因此，才希望透過科技結合藝術，創造共融場域，提供更多元的藝文參與方式。

熱門新聞