Formosa Vision 是一個由在地社群 Twinkle AI 號召的專案,致力於建立開放授權的圖文資料集,讓 AI 能更深入理解並傳承臺灣島嶼的獨特樣貌。這群成員懷抱對 AI 與開源技術的熱情,共同推動屬於臺灣的數位文化資產。

當全球 AI 模型逐漸主導內容產出,臺灣的文化與語境正面臨邊緣化風險。為此,在地社群 Twinkle AI 團隊致力建立開放授權的圖文資料集――Formosa Vision,確保 AI 能理解並傳承島嶼獨特風貌。

專案導師黃亮勳指出,國際視覺語言模型如 Gemma、LLaMA 系列雖技術先進,卻對臺灣影像陌生。若 AI 內容輸出由外部語法主導,將影響下一代對在地風土的理解與文化傳承。學員劉俊彥補充,Formosa Vision 專案正是為了回應此風險,讓臺灣語境與價值觀在 AI 時代中持續發聲,而非任由外來模型定義臺灣文化。

從誤判到理解,在地數據奠定文化基石

團隊發現,模型若缺乏在地數據,容易出現誤判。如 AI 曾將婚喪花圈誤認為警戒標示,將山道粗繩誤判為防落石設施,反映其對臺灣文化理解不足。

導師陳旻詣指出,若 AI 無法理解臺灣的文化與事理,人機協作將面臨根本困境。他舉例,當外國旅客在臺迷路拍照求助,模型若不識地點,便無法協助。學員黃冠維補充,現有模型在描述圖片時,若帶入地理或歷史知識,語言常顯生硬,須透過人工補足脈絡,這正是 Formosa Vision 的核心價值。

資料收集上,團隊從國家文化記憶庫 200 萬筆資料取出 3 千多筆,依循 CC BY、ODGL 與 PDM 等開放授權條款篩選,確保資料集自由使用。學員梁廣廷分享,他整理的照片涵蓋古道、海景、馬祖戰地標誌與桃園眷村等。學員林伯燊補充,團隊期望藉影像重新認識臺灣歷史,例如原住民部落遺跡多被草木覆蓋,若遭忽略,實屬可惜。

Formosa Vision 亦重現臺灣真實語境的多語混合特性,像是日治時期日文、馬雅各傳教士文法、國民政府遷臺書寫方式、原住民族語等。學員黃仁和指出,許多資料集僅標示物件,本專案則補充文化與歷史脈絡。教 AI 辨識只是起點,理解影像背後的歷史與人情,才是目標。

資金法規雙重考驗,主權 AI 仍待突圍

不論 Formosa Vision 專案,還是 Twinkle AI 團隊長期都面臨諸多挑戰。黃亮勳坦言,開源專案難在人才招募與社群維運,許多人因理念投入卻在半途默默離開。所以他持續推動開源專案曝光,以吸引志同道合者加入並形成長期夥伴關係。

算力資源取得不易,也是瓶頸。本專案採用 DGX 等級伺服器部署推論模型以支援圖片審核作業,整體 GPU 伺服器建置成本超過新台幣百萬元。所幸獲黃亮勳任職的 APMIC 公司支援,補足算力缺口,使專案順利推進。他認為,若政府能在經費與算力基礎設施上提供長期支持,將有助臺灣 AI 生態穩定發展。

臺灣在模型訓練領域面臨的核心挑戰,在於缺乏足夠的繁體中文在地化資料集。訓練過程長達八成時間用於資料準備,係因缺乏資料如同無食材,難以烹調高品質模型。梁廣廷呼籲政府推動資料探勘例外條款,避免 AI 研究者因爬取公開資料而面臨訴訟風險,並建立專責審查機制,保障研究安全與效率。

劉俊彥補充,臺灣著作權法對 AI 訓練限制嚴格,另外多數文史工作者傾向使用 CC BY-NC 授權,壓縮資料可用性。即便政府高層支持釋出資料,基層承辦人員因法律風險卻步,使進度受阻。建議政府提供明確法規與配套,讓資料釋出者無後顧之憂。

此外,陳旻詣提醒,對岸模型的語法風險與資料污染問題亦不容忽視。不少教師被迫使用對岸模型產出簡體資料,再透過 OpenCC 轉為繁體,導致大量錯譯,如「濃郁」變「濃鬱」、「虱目魚」誤為「蝨目魚」。唯有強化本地資料的語境一致性與品質,才能從根本上抵禦語料偏差,建立臺灣自主語料優勢。

實戰培訓與開放精神,點燃在地 AI 星火

黃亮勳與陳旻詣曾參與大語言模型計畫,深知高品質資料集對AI訓練的重要性。他們分享實戰經驗,協助社群學員將資料集快速轉化為優質問答對(QA Pairs),這些都是學校未曾教授的技能。

黃仁和指出,臺灣 AI 教育長期偏重演算法,卻忽略資料收集與清理訓練。學生使用現成模型與資料集,成果常不如預期,這正是 Twincle AI 團隊力求避免的陷阱。林伯燊表示,透過專案學習到從結構化資料庫進化為訓練集的處理細節,獲益良多。

跨域協作亦是 Formosa Vision 專案的一大特色。學員曹惟萌來自非資訊背景,他坦言,政府若能提供更多磨練與實習機會,將有助不同領域人才跨越 AI 專案的參與門檻。梁廣廷則補充,產業與學術間的媒合管道仍待建立,政府應積極牽線、促進跨界合作。

算力不足亦為痛點。儘管政府提供算力租借計畫,但申請流程繁冗,資源常被大型企業瓜分,中小新創與學界難以申請。建議簡化流程並設立配額,保障基層研究者的使用權。

秉持開源精神,Twinkle AI 團隊將 Formosa Vision 專案在內的訓練工具、程式碼與評測框架全數開放,如 Twinkle Gallery 訓練平臺與 Twinkle Eval 評測框架皆已開源。未來將持續打造繁體中文資料集與模型權重,拓展至聲音等多模態領域,並串聯媒體與民間組織,鼓勵開放私有文字資料。

黃亮勳亦憂心,若模型權重長期不開放,國人將被迫依賴對岸或西方模型。其實臺灣有許多從事模型微調的廠商,若能開放部分權重供研究使用,勢必能促進在地 AI 研究與產業共榮。

Formosa Vision 團隊透過本次補助,已著手建立在地視覺資料集與開源訓練框架,踏出實踐的第一步。雖然目前仍是起步階段,但方向明確。團隊期望未來能與更多認同開源精神、關心臺灣文化傳承的夥伴攜手同行,讓臺灣 AI 的發展逐步扎根、持續發光。


臺東碳匯平台的開源實踐
臺東自由軟體愛好者社群召集人王振民老師(暱稱王大),與臺東大學圖資館謝明哲館長合作指導學生,以 AI 影像識別結合區塊鏈技術,建立植樹後碳匯管理追蹤平台。王老師帶領三位學生含牛禹喬等人共同開發,並開放盤查系統供社群使用,展現地方實作與開源精神的結合。

熱門新聞

Advertisement