國科會釋出70億參數的TAIDE模型,開發者可至TAIDE官網下載使用。

圖片來源: 

螢幕截圖

2022年末ChatGPT爆紅,掀起大型語言模型(LLM)應用浪潮,為能夠在地化運用,國科會去年初就開始推動可信任生成式AI發展先期計畫(Trustworthy AI Dialogue Engine,簡稱TAIDE),來打造本土化LLM。經過1年多努力,國科會主委吳政忠今日(4/15)宣布釋出TAIDE-LX-7B,是一款結合臺灣文化的70億參數大型語言模型,可供產學研快速導入生成式AI、提供更多元服務。

具臺灣特色的可信任LLM

與現今其他大型語言模型不同,TAIDE-LX-7B模型具有繁體中文的文本生成能力。這是因為,團隊以Meta Llama-2-7B為基礎,額外擴充繁體中文字元、字詞,讓模型生成的文本更加流暢、精準,還更具有臺灣特色。

尤其,訓練模型所使用的文本資料,皆以合法取得授權的文本來訓練。這麼做不只確保「可信任性」,還能協助TAIDE-LX-7B加強臺灣文化、用語與國情等知識,從而產生豐富多樣的文本內容。團隊也對模型加強訓練5大功能,包括自動摘要、寫信、寫文章、中翻英、英翻中等,並開發出多輪問答對話能力,讓模型能根據已生成的文本內容,接續使用者指令,產出更符合需求的文本。

國科會希望,藉這次釋出,可促進TAIDE語言模型在公部門或民間機構的各類應用(含商業應用)。使用者現可進入TAIDE官方網站,了解模型發展目標與歷程,並點入網站上「TAIDE模型」連結,再進入該頁面中提供的Huggingface連結下載,就可開始使用、體驗具有臺灣特色的大型語言模型。

已有不少應用案例出現

不只如此,TAIDE-LX-7B模型已有不少應用,比如高雄大學團隊開發一套開源生成式AI應用平臺Kuwa GenAI OS,專門讓開發者用來打造生成式AI應用;該平臺內建可串接多款開源LLM,TAIDE模型就包括在內,開發者可靈活組合、串接周邊功能,而使用者則能透過簡易的Web介面,來與後端模型互動。其他應用案例還有臺南大學的TAIDE臺語對話機器人、中興大學神農TAIDE、中研院行政常見問題回應、民間公司智慧客服等。

熱門新聞

Advertisement