OpenAI六年首推開源大模型 Altman稱其為全球最佳開源模型

OpenAI首次於六年內推出開源大模型,標誌著其在開源人工智能領域邁出重要步伐。

美東時間2024年8月5日,OpenAI正式發布兩款開源大語言模型gpt-oss-120b和gpt-oss-20b,這是自2019年推出GPT-2以來首次釋出開源大模型,也是OpenAI與微軟共同研發獨立雲服務合作六年來,首次批准此類模型的大規模發布。

評價指,OpenAI新推的兩款模型直面Meta、微軟支持的Mistral AI,以及中國創企新星DeepSeek等競爭對手,在開源大模型領域展開競爭。

OpenAI行政總裁Sam Altman表示:

「gpt-oss是重大突破,屬於全球最先進的開源大模型,具備與o4-mini相當的強大現實世界能力,可於個人電腦甚至手機本地運行。我們相信這是全球最佳且最實用的開源模型。」

兩款模型定位為低成本GPT模型選擇,支援開發者、研究員及企業輕鬆運行和定制。gpt-oss-20b可於16GB記憶體的筆記本電腦上順利運行,gpt-oss-120b則需80GB記憶體,兩者均支援高級推理、工具使用及鏈式思考處理功能。

Altman指出,這兩款模型可在個人電腦(PC)甚至手機上本地運行,無需互聯網連接,為用戶提供完整控制權及隱私保障。

同時,亞馬遜宣布將首度於其Bedrock與SageMaker雲平台提供OpenAI的開源AI權重模型,標誌著雲計算巨頭對OpenAI產品的採納與支持。

gpt-oss-20b與120b的發佈標誌著OpenAI在策略上的重要轉變。此前公司多次推遲開源模型釋出,並進行廣泛安全測試和評估,以確保模型不被惡意利用。

開源模式居於源代碼和封閉代碼之間,令企業及政府機構能自主運行並查看模型權重及進行修訂;用戶亦能檢視模型源代碼組成,有時涵蓋訓練數據和權重分配方式。

此前有評論認為,OpenAI的開源決策或將削弱微軟在AI領域的獨占優勢。微軟一週內宣布將gpt-oss-20b GPU優化版本導入Windows設置,方便本地推理與模型構建。

gpt-oss-120b部分測試性能超越o4-mini 20b表現亦出色

OpenAI表示,兩款模型皆採用先進的預訓練與後續微調技術,重點提升推理、效能及跨平台實用性。兩者均使用專家混合(MoE)架構減少處理活躍參數數量。

gpt-oss-120b每個token激活51億參數,總參數量1170億;gpt-oss-20b激活36億,總參數210億。模型使用交替稠密與局部稀疏注意力機制,並採用分組多查詢注意力以提升推斷與記憶效率。

在2019年至2025年數個基準測試中,gpt-oss-120b在競賽編碼(Codeforces)、一般問題解決(MMLU、HLE)及工具調用(TauBench)上表現優於OpenAI o3-mini,並與o4-mini不相上下,甚至在健康相關查詢(HealthBench)及數學競賽(AIME 2024及2025)中超越o4-mini。

gpt-oss-20b雖為中型模型,但於相同評測中達到或超越OpenAI o3-mini,特別在數學競賽與健康領域取得更佳成績,且記憶體需求大大降低,適合邊緣設備使用。

安全防護與惡意使用預防

OpenAI在開源模型安全性方面投入大量關注,強調於訓練和釋出前已通過嚴格安全評估。公司針對生物、化學、放射性及核風險(CBRN)建立有害數據監控,並設置針對網絡安全和生物安全的特定審查版塊。

OpenAI與三個獨立專家組合作,提供惡意使用的反制措施。Altman強調:「我們致力於減輕最嚴重的安全問題,尤其是生物安全領域。gpt-oss模型在內部安全測試中展現的表現與我們現有前沿模型相當。」

生態佈局與市場影響

兩款模型採用Apache 2.0許可協議免費發布,使用者可透過Hugging Face與GitHub等平臺下載。雲服務供應商如亞馬遜、微軟Azure等也開始支援該模型推論。

OpenAI與Azure、vLLM、Ollama、AWS、Fireworks等領先推論平台合作,確保模型可在多種硬件環境良好運行。微軟將GPU優化版本gpt-oss-20b引入Windows設備,進一步方便本地開發者使用。

目前OpenAI正舉辦安全挑戰賽,獎金池高達500,000美元,鼓勵全球研發人員協力發掘並解決安全問題。

Altman指出:「我們相信這將帶來更多正面效益而非負面,希望新釋出的開源模型可推動前沿研究與新品開發。」

市場壓力驅動戰略轉變

此次釋出開源權重背後承受來自市場和技術競爭者的壓力,特別是中國DeepSeek、阿里巴巴Qwen、Moonshot AI等中國創業公司,以及Meta近年表現下滑的LLaMA模型。

OpenAI自2019年始專注透過API提供專有模型服務,但市場對開源模型需求持續增長。此次轉向公開開源,有助保持技術領先並擴大生態系,激發更多創新應用。

OpenAI總裁Greg Brockman本週表示:「生態系快速發展令人興奮,未來持續推動開源模型與技術進步是重點。」

OpenAI亦與英偉達、AMD、Cerebras和Groq等芯片商攜手合作,確保模型於各大硬件平台表現穩定。

綜合看,OpenAI此次推出的gpt-oss-120b與20b不僅回應全球對開源AI的期待,同時為人工智能生態系統注入更多活力與競爭動力。

參考資料:OpenAI官方發布資料、TechCrunch、Wired、CNBC報導、OpenAI GPT OSS模型卡、Apache 2.0許可協議

市場重要性與影響評估: 高影響 — OpenAI首次於六年內推出開源大型語言模型,標誌著人工智能領域重要的政策與技術突破,將引發產業競爭與生態系統的深遠變化。
影響範圍: 全球 — 涉及全球AI技術生態,涵蓋美國、中國及歐洲主要市場及雲端服務供應商。
影響時長: 長線 (12+ 個月) — 反映結構性趨勢,推動AI開源生態系統與競爭格局演變。
市場敏感度: 部分已反映 — 市場已預期OpenAI將持續推動技術開放,但此次大規模開源模型發佈及其低成本運行特性仍被低估,未完全反映於股價中。
投資策略:

  • 長線布局AI基礎設施與雲端服務供應商,如微軟 (MSFT)、亞馬遜 (AMZN)、英偉達 (NVDA),受惠於AI模型運算需求與生態系統擴張。
  • 關注AI開源生態競爭者,如Meta (META)及中國創企DeepSeek、Qwen,評估其技術進展與市場份額變化,中線持有以捕捉技術迭代機會。
  • 投資於支持AI模型本地運行與邊緣計算的硬體及軟體企業,尤其具備GPU優化技術及安全防護解決方案的公司,短線及中線均具吸引力。

風險:

  • AI開源模型可能引發安全與隱私風險,若惡意利用增加,將導致監管加嚴,影響相關企業營運及市場情緒。
  • 市場競爭激烈,尤其中國AI創企及大型科技公司積極布局,可能壓縮OpenAI及其合作夥伴的市場空間。
  • 技術成熟度與用戶採用速度不確定,模型性能雖優,但實際應用落地及商業化仍需時間。

其他觀點:

  • 部分專家認為OpenAI開源策略將促進AI技術民主化,降低使用門檻,推動更多創新應用誕生。
  • 亦有觀點指出,開源可能削弱OpenAI在AI領域的獨占優勢,促使更多競爭者加速技術研發。
風險提示及免責聲明
市場有風險,投資需謹慎。本文不構成任何個人投資建議,亦未考慮到個別用戶特殊的投資目標、財務狀況或需求。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定情況。據此投資,責任自負。