中央研究院資訊科技創新研究中心研究員兼資通安全專題中心執行長李育杰表示,自去年底ChatGPT浪潮開始,潛藏資安風險備受注目,打造本土適用的可信任AI對話引擎至關重要,在8月底數位政府高峰會上,他揭露TAIDE最新進展,9月正邁向開放測試申請的階段。(攝影/羅正漢)

隨著生成式AI能力進步,去年底邁向廣泛應用階段,為了應對伴隨而來的風險,我國政府公部門如何因應是當今焦點,例如,國科會7月中旬公告的公務機關生成式AI參考指引草案,行政院在8月31日宣布通過,要讓行政院及所屬機關在使用上有所依循,也促進其他機關參考訂定自己的管理規範,而隨著英文、簡體中文版聊天機器人接連問世,國科會在上半年號召國內學術團隊和國科會轄下機構,啟動TAIDE計畫,開始打造專為臺灣使用者設計的可信任AI對話引擎--TAIDE(Trustworthy AI Dialog Engine),自今年6月第一階段成果揭露後,如今9月將開始邁向大規模測試階段。

在8月底舉行的數位政府高峰會上,中央研究院資訊科技創新研究中心研究員兼資通安全專題中心執行長李育杰指出,TAIDE公部門應用即將開放測試,將率先於9月邀請部會報名,並於10月提供測試帳號。

今年7月Llama 2開放商業授權,促使TAIDE學研與商用模型發展更順利

關於TAIDE的發展與應用,統籌相關開發工作的李育杰表示,今年初他們先是以開源大型語言模型BLOOM為基礎,進行訓練調校,但後續已經改用Meta開源的Llama,藉以獲得更好的效能。

不過,由於Llama只有開放學術授權,因此他們當時規畫是先做學術授權的版本,再進行商業授權版本的開發。

值得關注的是,最近一個多月他們有了很大的進展,李育杰指出,這是因為Meta在7月中旬對外釋出的Llama 2,首度開放商業授權,這不僅讓他們打造商用版TAIDE模型有了更好的基礎,像是Taide-llama2-13B-Chat模型已顯示相當不錯的評估結果,更大意義在於,他們在學研與商用模型發展的經驗與資源可共軌。

事實上,在最近一個月,我們看到各界對於Llama 2的應用相當關注的情形。如此看來,這絕對是TAIDE的整體進度變得更順利的關鍵。

基本上,TAIDE是使用大量正體中文資料微調而成,融入臺灣特有的語言、價值觀、風俗習慣等元素,讓這套生成式AI能理解與回應本土使用者的需求,加上正體中文的多元訓練素材,將提升模型對不同主題領域的表現,並隨著模型持續擴大訓練,可使它更加厲害。

現階段TAIDE提供何種應用?李育杰指出,他們的發展先聚焦在辦公室4項日常生產力工作,包括中英翻譯、自動摘要、寫Email,以及出題目就能產生作文等任務,如今這些面向都有超越預期的表現,當應用在修改作文方面,也達到文句通順、句子不重複的效果。因此,TAIDE計畫團隊將在9月初就會開始邀請部會報名,9月中開放試用申請報名,預計10月初就會提供測試帳號,讓大家可以應用與嘗試。

到了10月中下旬,TAIDE計畫團隊還將舉行線上會議,並對中央政府部門舉辦工作坊,再擴及地方政府部門,向各機關人員介紹這套模型與使用教學。

李育杰指出,現階段TAIDE開放測試的主要目的,是讓與會單位能瞭解這套AI對話引擎,以及如何運用它,並且希望促使大家發想出更多應用可能性。後續公部門若有更多應用上的提案,TAIDE計畫團隊也將持續探討可行性,並且就訓練資料取得上獲得進一步的合作。未來,TAIDE計畫團隊希望政府或業界都可基於這套AI對話引擎,根據需求,自行訓練模型並建立內部應用。

熱門新聞

Advertisement