
GitHub
在公眾期待下,在GPT-2推出6年後,OpenAI昨(5)日宣布釋出2款開放權重的模型gpt-oss系列,目前僅支援文字,但具備高效能及推理能力。
最新釋出的模型包含gpt-oss-120b及gpt-oss-20b。gpt-oss-120b號稱是該公司最強大的開放權重模型,適合單一H100 GPU平臺。gpt-oss-20b則為中等規模的開放模型,適合低延遲性應用。二者都是以寬鬆Apache 2.0授權開放,允許使用者自由開放,適合實驗、客製或商用部署。
功能面而言,目前gpt-oss-120b和gpt-oss-20b都僅支援文字輸出輸入(尚不支援影音)和基礎的回應,但是效能強大:提供131,072 context window,最大輸出131,072 token,也雙雙使用完整思維鏈可提升除錯和輸出品質,並且都具備代理人能力,支援函式呼叫、上網、Python程式碼執行及結構化輸出。此外,兩模型都允許依據應用場景和延遲性需求,調整推理能力強度、或微調參數。
OpenAI也提供二個模型和旗艦模型OpenAI o3和o4-mini的比較。作為免費模型,gpt-oss-120b在推理與知識、數學緊追封閉模型,甚至在標竿測試AIME 2024中還超越o3及o4-mini。
這是繼2019年的GPT-2、2021的CLIP和2022年的Whisper開放計畫之後,再度釋出開放權重的重要模型。今年初中國DeepSeek引發關注,掀起美國業界討論必須以開放模式加速AI普及,使OpenAI備受開放模型的壓力。今年3月執行長Sam Altman承諾會釋出開放權重模型。
透過最新公布,OpenAI說開放模型允許政府或講求資料安全的組織自建模型及AI應用,該公司也計畫把二個模型整合到今年5月宣布的OpenAI for Countries(國家合作計畫),協助各國政府(第一個是美國)打造AI資料中心並確保資料主權。
熱門新聞
2025-12-12
2025-12-16
2025-12-15
2025-12-15
2025-12-15
2025-12-15
2025-12-16
2025-12-15