谷歌在2026年Google Cloud Next大會上正式發布第八代自家定制的張量處理器(TPU),分別推出專注於訓練的TPU 8t及針對推理的TPU 8i,這是谷歌首次將訓練與推理任務拆分至不同晶片,標誌著AI硬件架構的重要轉向。
兩款TPU預計於2026年下半年開始對外供應,TPU 8t相比上一代Ironwood TPU,性能提升2.8倍,TPU 8i則提升約80%。每瓦效能較前代提升逾一倍,分別達124%及117%。這兩款晶片核心採用了基於Arm架構的Axion CPU頭,解決數據準備階段主機側瓶頸,計算資源得以大幅擴展。
因應AI工作負載分化,分工研發兩款TPU晶片
谷歌指出,AI訓練與推理工作在延遲、計算需求和效率優化上差異顯著,單一晶片同時兼顧反而效率偏弱。TPU 8t專注於大規模預訓練,追求吞吐量與模型擴展能力;TPU 8i則針對低延遲推理優化,提升推理時的吞吐效率與響應速度。
兩款晶片均分享核心軟件基因,融合谷歌AI軟體棧,並由谷歌DeepMind深度參與設計。TPU 8t強化了硬體層SparseCore加速器及FP4原生支持,提升大規模矩陣運算與數據搬運效率;TPU 8i則大幅增加內部SRAM容量至384MB,是上一代的三倍,對長上下文語境處理及鍵值緩存表現尤為關鍵。
TPU 8t:加速訓練,打造超級計算節點
TPU 8t支援最高由9,600塊晶片組成的superpod,最高算力可達121 ExaFlops,並配備2PB高速高頻寬內存。引入新穎的Virgo網路架構連接,兼具高頻寬與低延遲特性,可串接超過13.4萬顆TPU芯片,實現160兆ExaFlop等級運算能力。
存儲方面,TPU 8t搭載TPUDirect RDMA及TPUDirect Storage,主機CPU能直接與TPU高速內存及網絡卡通訊,系統存儲訪問速度提升10倍,確保在大規模數據集多樣化訓練下穩定滿載。
TPU 8i:專攻推理,滿足低延遲高效能需求
TPU 8i專注推理優化,晶片內置最大384MB靜態隨機存取記憶體(SRAM),大幅提升推理過程中鍵值緩存(KV Cache)能力。TPU 8i改良網絡拓撲,捨棄TPU 8t的3D torus結構,以Boardfly互聯擴展,可支持1152顆晶片的聚合Pod,減少資料傳輸延遲與功耗。
同時,引入硬體加速的Agentic AI執行引擎,能快速響應多步推理與複雜任務流程,適合未來涵蓋多任務並行推理的AI代理(Agent)體系。
軟件生態深度整合與市場意義
谷歌第八代TPU全面支持JAX、PyTorch、Keras及vLLM等主流AI框架,並提供Pallas自定義內核語言,充分挖掘硬件加速潛能。PyTorch完整支持達預覽階段,使用戶可無縫將模型移植TPU,無需改動代碼。
從市場角度,分拆兩款晶片響應了訓練與推理需求不一的趨勢,有助於降低硬件資源浪費,並透過專項優化大幅提升性價比。藉由專用硬件配合配套軟件優化,谷歌致力於降低AI基礎設施成本,提升雲端AI服務競爭力。
此外,TPU 8t與8i均已納入谷歌AI超級計算架構——AI Hypercomputer,並結合先進的網絡、存儲與軟件管理技術,打造從芯片到系統的端到端AI生態,支撐下一代大型AI模型全面部署。
結語
谷歌第八代TPU於2026年推出雙芯策略,營造專攻訓練與推理的硬體分工,貼合當前AI工作負載日益分化的現實。TPU 8t主打超大規模訓練效率,TPU 8i則聚焦提升推理性能與響應速度。伴隨強大的軟件生態與系統整合,將促進AI研發與部署成本降低,助力雲端AI服務競爭力顯著提升。
參考資料:Google Cloud Next 2026官方發布資料、TechPowerUp技術分析、《經濟日報》報導
市場重要性與影響評估: 高影響
影響範圍: 全球
影響時長: 中長期(3-12個月及12個月以上)
市場敏感度: 事件部分已被市場預期,但細節性能與戰略意涵仍具潛在低估空間潛在市場影響:
- 谷歌第八代TPU推出專注於AI訓練(TPU 8t)與推理(TPU 8i)雙晶片策略,標誌AI硬體架構的重要轉型,將加速大型AI模型訓練與實時推理的效率與規模。
- TPU 8t在性能上較前代提升約2.7倍的性價比,且支援超大規模晶片集群,強化谷歌在雲端AI超級計算領域的競爭力,有助於降低大型AI模型訓練的時間和成本。
- TPU 8i專注推理優化,提升約80%性能成本比,特別針對低延遲需求和多代理AI場景,這將推動AI即時推理應用的普及與成本效益提升。
- 雙晶片架構配合谷歌自家Axion CPU及新型網路拓撲(Virgo Network、Boardfly ICI),整合硬體與軟體生態系,提升系統層級運算效率與穩定性,有望促進AI基礎設施的演進。
- 此舉可能加劇與NVIDIA等AI晶片巨頭的競爭,並可能改變AI晶片市場格局,尤其在推理晶片領域帶來新一波技術與價格競爭。
- 谷歌計劃將TPU 8系列對外供應,擴大市場影響力,有助於推動AI硬體生態系多元化與雲端AI服務競爭力提升。
風險:
- AI晶片市場競爭激烈,NVIDIA及其他競爭對手持續技術創新,谷歌TPU能否持續保持技術領先與市場份額尚具不確定性。
- TPU 8t與8i分工策略雖提升效率,但市場接受度及軟硬體生態系整合度需時間驗證,初期可能面臨部署與兼容挑戰。
- 全球半導體供應鏈波動及地緣政治風險,可能影響TPU晶片的生產與交付進度。
- AI應用需求快速變化,未來硬體需求與架構可能因新興AI模型演進而調整,存在技術路線被替代的風險。
其他觀點:
- 部分分析師認為谷歌此舉不僅是技術升級,更是AI基礎設施戰略轉型,強調軟硬體協同設計的重要性,對未來AI生態系統形成深遠影響。
- 業界觀察者指出,分工明確的訓練與推理晶片,有助於降低AI服務的整體成本,促使更多企業採用先進AI技術,推動AI普及化。
- 有觀點認為,谷歌TPU對外供應策略將加速雲端AI計算市場集中化,對中小型AI服務商形成雙刃劍效應,競爭壓力加劇。
備註:
- 本分析僅供參考,不構成投資建議。

