聽著MP3撥放器裡的曲子,或是到卡拉OK裡面去高歌一番,幾乎是多數人接觸音樂的管道,不論是令人興情愉悅的輕快旋律,或是心有戚戚的失戀情歌,這些音樂是我們娛樂生活中不可或缺的一部分,且聽歌、唱歌也是很多人最愛的休閒活動。在資訊時代來臨,多媒體數位化之後的音樂歌曲,也能透過IT科技來發展更多元應用,例如多功能伴唱機、數位劇院等,都讓休閒時的視聽饗宴更加豐富。

音高分析,哼唱片段音樂找出原曲
 

多數人都有這樣的經驗,在餐廳用餐或逛街時,常會聽到店家播放各種歌曲,有時候覺得歌曲很動聽,但卻不清楚歌曲名稱時,也沒辦法用關鍵字上網找出想聽的那條歌,心裡面多少會感到可惜,因此國立台灣大學資訊工程系暨研究所教授張智星博士投入研究,透過電腦科技發展出Miracle網路音樂搜尋引擎系統,只要記得歌曲旋律並能哼唱出來,就能透過聲音分析、比對歌曲資料庫,找出旋律來自於那一條歌曲。
「現實生活中,主要有兩種情境會應用到歌曲比對搜尋應用,一種是哼唱選歌,將我們人唱出的聲音或哼出的旋律輸入電腦,再去分析、比對搜尋出該首歌曲;另一種方式則是原曲選歌,是直接錄下一小段歌曲,輸入電腦後去找出這首歌的曲名與原唱人是哪一位。」張智星教授說明時表示:「哼唱搜尋與原曲比對這兩種應用非常相近,但底層的技術細節大不相同,而在技術上有相同的部分,就是要仰賴大量的電腦運算資源,去比對輸入片段音樂與歌曲資料庫來找出原來的歌曲。」

以哼唱選歌功能為例,使用者只要啟動自己的麥克風,同時上網進入Miracle網路音樂搜尋引擎,對著錄下8秒旋律片段,就可以找出歌曲的曲名與主唱,而後端的技術處理方式,是先將收錄的聲音轉換成音高,再與資料庫內所有歌曲進行音高比對,找出音高向量最相近的歌曲,就能為使用者找出那首歌的歌名與演唱人等資訊。
2001年剛投入數位音訊研究分析時,張智星教授以CPU來處理頻譜能量分析,會需要建置多台電腦來建立平行處理系統,但以10台電腦建立起的CPU平行運算能量,在哼唱選歌的歌曲搜尋上,過濾1萬3千首以上歌曲,依然要花費20秒左右的時間,而改用NVIDIA CUDA搭配NVIDIA Tesla系列GPU晶片來運算後,相同資料比對處理時間只需3秒就能完成,效率提升非常多,讓歌曲比對功能更能符合實際應用,而且設備維護工作也相對簡單許多。

1秒鐘,完成14萬首歌曲比對
 

音樂搜尋引擎的另一功能:原曲選歌,則是透過頻譜能量分析,但主要是著重在特徵比對,在大量的歌曲資料庫中找出所屬的歌曲,目前張智星教授的原曲比對音樂搜尋引擎系統中共有14萬3千多萬首歌曲,在NVIDIA CUDA的效能下,找出原曲的時間也不用1秒,張教授也再不斷研究,持續增加歌曲資料庫內的樣本數量,讓音樂搜尋可配對的歌曲更多,幫助更多人找到想聽的歌曲。「接下來的目標,是要以一台機器在5秒內,完成比對100萬首歌曲,相信在NVIDIA CUDA與NVIDIA Tesla的幫助下,在數個月內即可達成此目標。」

從務實角度來看,如果歌曲搜尋要花費很多時間,代表使用人要花時間等待結果,而NVIDIA CUDA加快歌曲比對搜尋結果到3秒內,讓音樂搜尋引擎比以前更有應用價值,像是哼唱選曲功能可搭配卡拉OK伴唱系統,讓唱歌時的休閒活動更有趣味;而對唱片銷售業者來說,也可以透過音樂搜尋引擎,讓一般民眾輕鬆找出想聽的音樂,進而發掘潛在的客群。

改用CUDA,運算效率實踐商務應用
 

由於GPU在大量資料處理的效果非常顯著,張智星教授接觸並研究NVIDIA CUDA的運算特性後,發現到所有大規模檢索、比對等運算處理,像是音樂頻譜能量分析比對等,都非常適合採用NVIDIA CUDA來處理,能大幅提升處理效率,因此他也開始改寫比對分析工具,改由GPU運算來提升處理效率,克服了以往效能不彰的瓶頸,讓音樂搜尋這類資訊服務可以跨出實驗室,走入一般民眾的娛樂生活。
從CPU平行處理轉換到NVIDIA CUDA的GPU運算,張智星教授在開發工具改寫上並未花費太多時間,主要在於原本的分析工具與NVIDIA CUDA都是以C語言為基礎,因此開發語法轉換並不困難,他認為主要需考量的部分,在於分析工具的記憶體管理與配置方法。「要花費比較多心思的部分,在於分析工具最佳化的部分,主要是記憶體的使用配置,有些會由GPU運算的指令,存放到顯示卡記憶體上效果較佳,而使用CPU資源的則要放在主記憶體中,要達到最佳化就必須重新評估分析工具的運作方式,並將指令存放在最適當的位置來提升分析速度。」

張智星教授指出,當音樂檢索比對的準確度可以跟上實務標準時,就能結合許多其他應用,讓各種有使用到音樂、聲音的娛樂更加豐富且多元,例如哼唱比對技術也可以結合伴唱機,提供原唱比對評分功能,讓喜愛唱歌的人在引吭一曲之後,還能分析音準、節拍、咬字、抖音等,並與原唱歌手的版本比對,在根據相似程度評分,讓唱卡拉OK帶來更多的樂趣。

除了在歌唱等娛樂產業,利用NVIDIA CUDA加快聲音比對,也能廣泛應用在教學與商務行銷活動,像是開發出一套程式結合收音功能,來判別古典樂曲並帶出背後故事,或聽到流行音樂時能帶出相關商品,刺激出潛在的商機。張智星教授表示,現階段有很多技術發展無法與實務整合的最大瓶頸,在於處理速度無法滿足真實應用,例如颱風動態分析如果太慢會緩不濟急,而NVIDIA CUDA將大幅提升音樂檢索比對的運算速度,讓更多研究結果能豐富我們的日常生活。

關於NVIDIA (輝達)
NVIDIA(輝達)公司在1999年發明了繪圖處理器(GPU)後,便讓全世界認識到電腦繪圖功能的威力;如今,其處理器啟動從智慧型手機到超級電腦等廣泛的產品。NVIDIA的行動處理器,普遍應用於手機、平板電腦以及車用資訊娛樂系統中。PC遊戲玩家仰賴GPU,享受真正身歷其境的世界。專業人士利用GPU創造電影中精采的3D繪圖和視覺效果,也設計出從高爾夫俱樂部到大型噴射客機等各種物件。而研究員運用GPU,可以透過高效能電腦促進科學新領域的發展。NVIDIA擁有超過5,000項已核發、認可或申請中之專利,其中包括現代運算技術基礎之設計與深入研究。
http://www.nvidia.com.tw

熱門新聞

Advertisement