6年後 OpenAI再釋出開放權重的語言模型

圖片來源:

GitHub

在公眾期待下，在GPT-2推出6年後，OpenAI昨（5）日宣布釋出2款開放權重的模型 gpt-oss 系列，目前僅支援文字，但具備高效能及推理能力。

最新釋出的模型包含gpt-oss-120b及gpt-oss-20b。gpt-oss-120b號稱是該公司最強大的開放權重模型，適合單一H100 GPU平臺。gpt-oss-20b則為中等規模的開放模型，適合低延遲性應用。二者都是以寬鬆Apache 2.0授權開放，允許使用者自由開放，適合實驗、客製或商用部署。

功能面而言，目前gpt-oss-120b和gpt-oss-20b都僅支援文字輸出輸入（尚不支援影音）和基礎的回應，但是效能強大：提供131,072 context window，最大輸出131,072 token，也雙雙使用完整思維鏈可提升除錯和輸出品質，並且都具備代理人能力，支援函式呼叫、上網、Python程式碼執行及結構化輸出。此外，兩模型都允許依據應用場景和延遲性需求，調整推理能力強度、或微調參數。

OpenAI也提供二個模型和旗艦模型OpenAI o3和o4-mini的比較。作為免費模型，gpt-oss-120b在推理與知識、數學緊追封閉模型，甚至在標竿測試AIME 2024中還超越o3及o4-mini。

這是繼2019年的GPT-2、2021的CLIP和2022年的Whisper開放計畫之後，再度釋出開放權重的重要模型。今年初中國DeepSeek引發關注，掀起美國業界討論必須以開放模式加速AI普及，使OpenAI備受開放模型的壓力。今年3月執行長Sam Altman承諾會釋出開放權重模型。

透過最新公布，OpenAI說開放模型允許政府或講求資料安全的組織自建模型及AI應用，該公司也計畫把二個模型整合到今年5月宣布的OpenAI for Countries（國家合作計畫），協助各國政府（第一個是美國）打造AI資料中心並確保資料主權。

熱門新聞