KKBOX宣布聯手微軟,除了要共同推出BlendVision影音串流解決方案外,還要推出三大AI音樂服務,包括AI音樂預測、AI作詞作曲小幫手,以及新型態音樂市場預測系統。

圖片來源: 

攝影/王若樸

深耕亞洲15年的臺灣本土音樂媒體集團KKBOX Group 17日宣布加入微軟生態體系,進軍全球市場。先將自家4PB的資料和多項服務搬上Azure,也將自家BlendVision影音串流解決方案推到全球,此外還有AI歌曲爆紅預測系統、AI作詞作曲小幫手,以及明年即將推出的新型態音樂市場預測,還會用粉絲來計算音樂價值。

集結不同事業群研發成果,要上雲搶攻全球市場

KKBOX共同創辦人暨執行長林冠羣指出,以線上音樂平臺起家的KKBOX,近年來隨著市場變化,不斷嘗試轉型,在集團下也新增許多事業群,包括媒體事業群、內容事業群,以及負責想出新點子、不斷試錯的孵育事業群KKLab,還有技術事業群KKStream等。

其中,媒體事業群包括了原有的音樂串流平臺KKBOX、全臺最大的行動票務平臺KKTix、經營線下演唱會行銷等事宜的KKLive,還有OTT影音串流平臺KKTV。而內容事業群,則以KKFarm為主,鎖定音樂文創市場的痛點,來提供基金和資源,投資有潛力的文創團體。

而首次在媒體前曝光的KKLab,林冠羣指出,就像新創孵化器,旗下有不同的研究團隊,來發想新點子,不只是「催生其他事業體的關鍵,」也是「AI新服務的研發中心。」比如其中的KKBOX研究中心,就擁有約20位資料科學家,來負責全集團資料科學與機器學習專案,像是個人化音樂推薦、AI音樂預測系統、AI作詞作曲小幫手,以及正在開發的新型態音樂市場預測服務等。

至於4年前在日本成立的KKStream,主打影片串流畫質優化服務,靠著自動分類位元速率(Bitrate),來進行影片壓縮,大幅減少傳輸頻寬,就連日本第二大電信KDDI都愛用。

現在,KKBOX決定大舉將自家IDC機房的4PB資料搬上Azure,利用微軟認知服務來強化KKLab和KKStream的服務,並透過微軟來搶攻全球企業市場。

BlendVision整合串流影片優化技術降低頻寬成本,還要推出AI音樂預測系統與作詞作曲小幫手

進一步來說,KKBOX成為微軟夥伴後,會將原有先在日本推出的BlendVision影音串流解決方案,帶到全球市場。第一個服務就是BlendVision Streaming,整合了KKStream的按主題編碼技術(PTE)和感知串流引擎(PSE),來強化串流影片的畫質體驗。

KKStream總裁蔡怡仁表示,PTE是自家團隊開發的技術,可根據不同類別的影片,比如卡通、劇情片或動作片等,及其對應的畫面複雜度,來調節位元速率(如下圖),「進而降低傳輸頻寬、節省儲存空間,」甚至替日本電信客戶省下「60%以上的成本。」

而PTE的技術發展,並非一夕蹴成。蔡怡仁指出,起初,在替日本OTT和電信客戶開發解決方案時,常聽到客戶對傳輸頻寬成本的抱怨。後來,團隊依據影片類型、畫面複雜度和元資料(Metadata),在不影響視覺體驗的情況下,來調整位元速率、壓縮檔案,來降低頻寬成本。「先人工分類出3種影片開始實驗,來調整位元速率,」他表示,實驗成功之後,進一步擴增至數十種類型,靠不同演算法來壓縮檔案。而現在,「幾乎由AI自動分類,再透過人為驗證。」

另一方面,除了技術成熟的PTE,KKStream也正嘗試PSE,利用它來強化低解析度影片的畫面(如下圖),透過自動調整畫面反差、立體感、顏色和焦點畫質等,使原本低畫質的影片,也能如高清畫面一樣清晰呈現,可改善民眾的串流影音體驗。蔡怡仁表示,PSE目前還未商品化,最快預計明年上市。

未來,林冠羣表示,KKBOX要聚焦於三大AI音樂主題,也就是AI歌曲爆紅預測系統、AI作詞作曲小幫手和音樂新型態市場預測。在歌曲預測部分,「我們運用10幾年累積下來的數千億筆點播資料,來訓練AI模型、替歌曲算命;」他解釋,一首歌只要上線3天,就有足夠的資料量讓系統計算,並能預測未來6個月是否會受歡迎,不僅「準確度很高,還可用來建議唱片公司或歌手,應如何調整歌曲或風格。」

臺灣微軟合作夥伴暨商務事業群總經理林劍福補充,這套預測系統是以KKBOX資料為主,再利用微軟認知服務來訓練模型。目前,KKBOX部分資料仍在進行搬遷,未來完全搬至Azure資料湖後,模型預測就會更精準。

除了音樂預測,KKBOX也正測試藝人生涯預測、演唱會門票預測等系統。

不只如此,KKBOX還將推出AI作詞作曲小幫手。林冠羣表示,在作詞上,已經與香港歌詞作家林夕簽約,利用他畢生所寫的4千多首歌曲歌詞,來訓練學習語言模型,學習他的風格、文筆。現在,只要林夕新寫一句歌詞,AI小幫手就能根據那句歌詞,產生一段風格類似的新歌詞(如下圖),林夕也可再來修改。「明年,林夕要與AI發表共同完成的歌詞作品,」林冠羣說。

另一方面,在作曲部分,團隊也利用不同形式和風格的音樂,來訓練音樂樂句模型,只要使用者輸入一段簡單的旋律,系統就能產生出風格、節奏相符的曲子,再交給使用者微調、修改。

最後,林冠羣表示,團隊也正在打造一款新型態音樂市場的預測服務,要改變過往對音樂價值的定義,也就是除了創作者本身和音樂之外,還要納入粉絲影響力,來重新衡量音樂在市場上的表現。他指出,這套系統「很快就會問世。」文◎王若樸

 
 
 
 

熱門新聞

Advertisement