國科會釋出繁中語言模型TAIDE-LX-7B了！

國科會釋出70億參數的TAIDE模型，開發者可至TAIDE官網下載使用。

圖片來源:

螢幕截圖

2022年末ChatGPT爆紅，掀起大型語言模型（LLM）應用浪潮，為能夠在地化運用，國科會去年初就開始推動可信任生成式AI發展先期計畫（Trustworthy AI Dialogue Engine，簡稱TAIDE），來打造本土化LLM。經過1年多努力，國科會主委吳政忠今日（4/15）宣布釋出TAIDE-LX-7B，是一款結合臺灣文化的70億參數大型語言模型，可供產學研快速導入生成式AI、提供更多元服務。

具臺灣特色的可信任LLM

與現今其他大型語言模型不同，TAIDE-LX-7B模型具有繁體中文的文本生成能力。這是因為，團隊以Meta Llama-2-7B為基礎，額外擴充繁體中文字元、字詞，讓模型生成的文本更加流暢、精準，還更具有臺灣特色。

尤其，訓練模型所使用的文本資料，皆以合法取得授權的文本來訓練。這麼做不只確保「可信任性」，還能協助TAIDE-LX-7B加強臺灣文化、用語與國情等知識，從而產生豐富多樣的文本內容。團隊也對模型加強訓練5大功能，包括自動摘要、寫信、寫文章、中翻英、英翻中等，並開發出多輪問答對話能力，讓模型能根據已生成的文本內容，接續使用者指令，產出更符合需求的文本。

國科會希望，藉這次釋出，可促進TAIDE語言模型在公部門或民間機構的各類應用（含商業應用）。使用者現可進入TAIDE官方網站，了解模型發展目標與歷程，並點入網站上「TAIDE模型」連結，再進入該頁面中提供的Huggingface連結下載，就可開始使用、體驗具有臺灣特色的大型語言模型。

已有不少應用案例出現

不只如此，TAIDE-LX-7B模型已有不少應用，比如高雄大學團隊開發一套開源生成式AI應用平臺Kuwa GenAI OS，專門讓開發者用來打造生成式AI應用；該平臺內建可串接多款開源LLM，TAIDE模型就包括在內，開發者可靈活組合、串接周邊功能，而使用者則能透過簡易的Web介面，來與後端模型互動。其他應用案例還有臺南大學的TAIDE臺語對話機器人、中興大學神農TAIDE、中研院行政常見問題回應、民間公司智慧客服等。

熱門新聞