千卡效率增超90% 摩爾線程聯手智源實現國產千卡集群具身智能模型高效訓練

隨著具身智能發展成為人工智能下一個戰略高地,底層算力自主可控顯得尤為關鍵。近期,摩爾線程聯合北京智源人工智能研究院(簡稱智源),基於FlagOS-Robo架構,依託MTT S5000千卡智能集群,成功完成智源自研具身大腦模型RoboBrain 2.5的全流程訓練

這是行業內首次驗證國產算力集群在具身智能大模型訓練中的可用性與高效性,標誌著國產AI基礎設施在應對複雜多模型任務上的關鍵一步。通過面向多元芯片的統一AI系統軟件棧FlagOS與MTT S5000硬件集群的高效協作,該解決方案不僅實現“能訓”,更達成了“訓得穩、訓得快”,為具身智能從實驗室走向產業落地提供了堅實底座。

RoboBrain作為智源面向真實物理場景打造的通用具身大腦

RoboBrain整合統一的視覺—語言多模型架構,為機器人在感知、認知、推理與決策上的核心能力提供基礎支撐。RoboBrain 2.5在原有通用具身大腦基礎上,新增了機器人對動作時序價值評估和三維空間結構的理解與推理能力,對下游任務執行成功率有顯著提升。

FlagOS-Robo則是基於開源開放的多芯片AI軟硬件棧FlagOS構建的,面向具身智能的訓練與推理一體化框架。它支持從端到雲的多場景部屬,兼容多種芯片,能夠同時實現大腦模型(VLM)與小腦模型(VLA)的高效協同訓練與推理。FlagOS-Robo打通從數據採集到真機與評測的全鏈路,覆蓋數據加載、模型訓練、推理到具身評測的全流程,有效降低了開發複雜度,支持多芯片統一實驗管理、自動調優等功能,實現一鍵跨本體部署。通過這一完整生態,FlagOS-Robo將為具身智能的前沿研究與產業應用提供強大的算力底座與系統化支撐,加速AI技術的創新與落地。

多維評測驗證,指標全面領先

為檢驗模型算法效果,智源團隊在2D/3D空間感知推理榜單、時序價值評估榜單等多個權威具身評測數據集上進行了驗證。結果顯示,基於MTT S5000國產千卡訓練出的RoboBrain-2.5模型,在多項關鍵指標上均與國際主流GPU訓練模型保持一致,尤其是在CrossPoint、Q-Spatial、VABench-V任務中,算法效果表現更優。這種全面領先的評測結果,證明FlagOS-Robo框架與MTT S5000算力協同訓練出的“具身大腦”,在理解、規劃和執行能力上已達行業一流水準。

Loss完美對齊,誤差低於0.62%

在模型精度方面,基於MTT S5000的超驕算力集群展現出極高的穩定性。訓練曲線顯示,MTT S5000千卡集群上的Loss走勢與國際主流GPU訓練結果高度重合,對比誤差小於0.62%。這一低誤差充分體現了國產算力訓練準確性的同時,FlagOS-Robo框架成功實現了跨平台零損轉移,開發者無需擔心硬件更換導致的模型性能下降,真正做到“代碼不改、精度不降”的平滑適配。

極致線性擴展,千卡加速比超90%

大規模集群訓練的核心在於效率。本次訓練實測數據顯示,摩爾線程MTT S5000千卡智能集群展現了超高的擴展能力:從64卡擴展到1024卡,系統實現了90%以上的線性擴展效率。擴展曲線呈現出極佳的線性增長趨勢,意味著隨著算力資源的增加,訓練速度幾乎同步倍增,充分證明了國產集群在大規模並行計算和通信調度上的成熟度,並具備支持萬卡級訓練的能力。

此次摩爾線程與智源研究院的深度合作,將進一步加速具身智能從實驗室走向產業落地的進程,為行業提供可複製、可規模化的“國產算力訓練範式”,為中國具身智能產業提供一個自主、開放且高效的算力底座。

參考資料:摩爾線程官方新聞稿、北京智源人工智能研究院訊息披露、公開報道

市場重要性與影響評估: 高影響
影響範圍: 地區(中國及香港市場具直接關聯,並對亞太區AI及半導體產業鏈有示範效應)
影響時長: 中長期(3-12個月及12個月以上,屬於結構性技術發展與產業升級趨勢)
市場敏感度: 事件已部分被市場預期,但技術與應用成熟度提升的幅度可能被低估

潛在市場影響:

  • 國產千卡級AI計算集群MTT S5000與RoboBrain 2.5模型的成功訓練,顯示國產AI硬體與軟體生態系已具備與國際主流GPU競爭的能力,推動中國在AI訓練基礎設施上邁向自主可控。
  • FlagOS-Robo系統整合多芯片架構與統一AI系統軟體,實現高效協同訓練與推理,顯著降低開發複雜度與成本,將促進具身智能(robotic intelligence)從實驗室向產業落地的轉化速度。
  • 90%以上的線性擴展效率提升,代表在大規模集群擴展時性能損失大幅減少,為國產AI集群大規模商用奠定基礎,並有助於吸引更多企業與科研機構採用國產硬體。
  • 此技術突破有助於推動國產AI芯片廠商(如華為海思、寒武紀、兆芯等)在市場競爭力提升,並促使相關產業鏈上下游(軟體、數據中心、雲計算等)同步成長。

風險:

  • 儘管國產AI集群展現出色的性能與穩定性,市場仍面臨國際芯片技術快速迭代與競爭壓力,國產方案需持續優化以保持競爭力。
  • 在大規模模型訓練中,集群穩定性與網絡親和性調優仍是挑戰,任何系統中斷或故障均可能導致訓練效率大幅下降,影響用戶體驗與成本控制。
  • 市場對國產AI硬體的接受度與生態系建設仍需時間醞釀,短期內可能受限於軟體兼容性及產業鏈支持的成熟度。

其他觀點:

  • 專家認為,FlagOS 1.6及RoboBrain 2.5的推出,標誌著國產AI生態系統從單一硬體或軟體突破,向整體生態鏈協同發展邁進,對提升中國AI產業自主可控能力意義重大。
  • 部分分析指出,國產AI集群在訓練效率與線性擴展性方面的提升,將對全球AI計算資源格局產生影響,有助於形成多元化、分散化的AI硬體競爭環境。
  • 亦有觀點提醒,隨著AI模型規模持續擴大,國產方案需加強對超大規模模型的支持能力,並在軟硬體協同優化上持續投入,以應對未來更高的技術要求。

備註:

  • 本分析僅供參考,不構成投資建議。
風險提示及免責聲明
市場有風險,投資需謹慎。本文不構成任何個人投資建議,亦未考慮到個別用戶特殊的投資目標、財務狀況或需求。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定情況。據此投資,責任自負。