OpenAI首次於六年內推出開源大模型,標誌著其在開源人工智能領域邁出重要步伐。
美東時間2024年8月5日,OpenAI正式發布兩款開源大語言模型gpt-oss-120b和gpt-oss-20b,這是自2019年推出GPT-2以來首次釋出開源大模型,也是OpenAI與微軟共同研發獨立雲服務合作六年來,首次批准此類模型的大規模發布。
評價指,OpenAI新推的兩款模型直面Meta、微軟支持的Mistral AI,以及中國創企新星DeepSeek等競爭對手,在開源大模型領域展開競爭。
OpenAI行政總裁Sam Altman表示:
「gpt-oss是重大突破,屬於全球最先進的開源大模型,具備與o4-mini相當的強大現實世界能力,可於個人電腦甚至手機本地運行。我們相信這是全球最佳且最實用的開源模型。」
兩款模型定位為低成本GPT模型選擇,支援開發者、研究員及企業輕鬆運行和定制。gpt-oss-20b可於16GB記憶體的筆記本電腦上順利運行,gpt-oss-120b則需80GB記憶體,兩者均支援高級推理、工具使用及鏈式思考處理功能。
Altman指出,這兩款模型可在個人電腦(PC)甚至手機上本地運行,無需互聯網連接,為用戶提供完整控制權及隱私保障。
同時,亞馬遜宣布將首度於其Bedrock與SageMaker雲平台提供OpenAI的開源AI權重模型,標誌著雲計算巨頭對OpenAI產品的採納與支持。
gpt-oss-20b與120b的發佈標誌著OpenAI在策略上的重要轉變。此前公司多次推遲開源模型釋出,並進行廣泛安全測試和評估,以確保模型不被惡意利用。
開源模式居於源代碼和封閉代碼之間,令企業及政府機構能自主運行並查看模型權重及進行修訂;用戶亦能檢視模型源代碼組成,有時涵蓋訓練數據和權重分配方式。
此前有評論認為,OpenAI的開源決策或將削弱微軟在AI領域的獨占優勢。微軟一週內宣布將gpt-oss-20b GPU優化版本導入Windows設置,方便本地推理與模型構建。
gpt-oss-120b部分測試性能超越o4-mini 20b表現亦出色
OpenAI表示,兩款模型皆採用先進的預訓練與後續微調技術,重點提升推理、效能及跨平台實用性。兩者均使用專家混合(MoE)架構減少處理活躍參數數量。
gpt-oss-120b每個token激活51億參數,總參數量1170億;gpt-oss-20b激活36億,總參數210億。模型使用交替稠密與局部稀疏注意力機制,並採用分組多查詢注意力以提升推斷與記憶效率。
在2019年至2025年數個基準測試中,gpt-oss-120b在競賽編碼(Codeforces)、一般問題解決(MMLU、HLE)及工具調用(TauBench)上表現優於OpenAI o3-mini,並與o4-mini不相上下,甚至在健康相關查詢(HealthBench)及數學競賽(AIME 2024及2025)中超越o4-mini。
gpt-oss-20b雖為中型模型,但於相同評測中達到或超越OpenAI o3-mini,特別在數學競賽與健康領域取得更佳成績,且記憶體需求大大降低,適合邊緣設備使用。
安全防護與惡意使用預防
OpenAI在開源模型安全性方面投入大量關注,強調於訓練和釋出前已通過嚴格安全評估。公司針對生物、化學、放射性及核風險(CBRN)建立有害數據監控,並設置針對網絡安全和生物安全的特定審查版塊。
OpenAI與三個獨立專家組合作,提供惡意使用的反制措施。Altman強調:「我們致力於減輕最嚴重的安全問題,尤其是生物安全領域。gpt-oss模型在內部安全測試中展現的表現與我們現有前沿模型相當。」
生態佈局與市場影響
兩款模型採用Apache 2.0許可協議免費發布,使用者可透過Hugging Face與GitHub等平臺下載。雲服務供應商如亞馬遜、微軟Azure等也開始支援該模型推論。
OpenAI與Azure、vLLM、Ollama、AWS、Fireworks等領先推論平台合作,確保模型可在多種硬件環境良好運行。微軟將GPU優化版本gpt-oss-20b引入Windows設備,進一步方便本地開發者使用。
目前OpenAI正舉辦安全挑戰賽,獎金池高達500,000美元,鼓勵全球研發人員協力發掘並解決安全問題。
Altman指出:「我們相信這將帶來更多正面效益而非負面,希望新釋出的開源模型可推動前沿研究與新品開發。」
市場壓力驅動戰略轉變
此次釋出開源權重背後承受來自市場和技術競爭者的壓力,特別是中國DeepSeek、阿里巴巴Qwen、Moonshot AI等中國創業公司,以及Meta近年表現下滑的LLaMA模型。
OpenAI自2019年始專注透過API提供專有模型服務,但市場對開源模型需求持續增長。此次轉向公開開源,有助保持技術領先並擴大生態系,激發更多創新應用。
OpenAI總裁Greg Brockman本週表示:「生態系快速發展令人興奮,未來持續推動開源模型與技術進步是重點。」
OpenAI亦與英偉達、AMD、Cerebras和Groq等芯片商攜手合作,確保模型於各大硬件平台表現穩定。
綜合看,OpenAI此次推出的gpt-oss-120b與20b不僅回應全球對開源AI的期待,同時為人工智能生態系統注入更多活力與競爭動力。
參考資料:OpenAI官方發布資料、TechCrunch、Wired、CNBC報導、OpenAI GPT OSS模型卡、Apache 2.0許可協議
市場重要性與影響評估: 高影響 — OpenAI首次於六年內推出開源大型語言模型,標誌著人工智能領域重要的政策與技術突破,將引發產業競爭與生態系統的深遠變化。
影響範圍: 全球 — 涉及全球AI技術生態,涵蓋美國、中國及歐洲主要市場及雲端服務供應商。
影響時長: 長線 (12+ 個月) — 反映結構性趨勢,推動AI開源生態系統與競爭格局演變。
市場敏感度: 部分已反映 — 市場已預期OpenAI將持續推動技術開放,但此次大規模開源模型發佈及其低成本運行特性仍被低估,未完全反映於股價中。
投資策略:
- 長線布局AI基礎設施與雲端服務供應商,如微軟 (MSFT)、亞馬遜 (AMZN)、英偉達 (NVDA),受惠於AI模型運算需求與生態系統擴張。
- 關注AI開源生態競爭者,如Meta (META)及中國創企DeepSeek、Qwen,評估其技術進展與市場份額變化,中線持有以捕捉技術迭代機會。
- 投資於支持AI模型本地運行與邊緣計算的硬體及軟體企業,尤其具備GPU優化技術及安全防護解決方案的公司,短線及中線均具吸引力。
風險:
- AI開源模型可能引發安全與隱私風險,若惡意利用增加,將導致監管加嚴,影響相關企業營運及市場情緒。
- 市場競爭激烈,尤其中國AI創企及大型科技公司積極布局,可能壓縮OpenAI及其合作夥伴的市場空間。
- 技術成熟度與用戶採用速度不確定,模型性能雖優,但實際應用落地及商業化仍需時間。
其他觀點:
- 部分專家認為OpenAI開源策略將促進AI技術民主化,降低使用門檻,推動更多創新應用誕生。
- 亦有觀點指出,開源可能削弱OpenAI在AI領域的獨占優勢,促使更多競爭者加速技術研發。

