谷歌押注「世界模型」 技術角逐超越ChatGPT的智能眼鏡時代

谷歌正透過押注能理解物理世界的「世界模型」,探索人工智能下一個質的飛躍。

據報導,谷歌計劃於2026年推出新型AI智能眼鏡,利用「世界模型」技術與Meta等競爭者角力差異化。該眼鏡將由谷歌與三星合作打造,與現有只能通過攝影頭描述畫面的產品不同,該設備著重理解三維空間、物理物體關係及環境動態,被視為谷歌在智能眼鏡領域的關鍵嘗試,有望改變人工智能眼鏡的產業標準。

這一布局也反映谷歌在AI競爭中逐步恢復失地。隨著Gemini 3系統成功發布,谷歌在性能榜單上領跑,並在用戶規模上縮小與OpenAI的差距,使公司能強勢回應競爭壓力。

超越聊天機器人:押注「世界模型」的策略

谷歌的戰略藍圖中,以ChatGPT代表的大語言模型(LLM)並非通往通用人工智能(AGI)的唯一道路。谷歌首席執行官Hassabis堅持,基於模型對真實物理世界及其環境進行訓練的「世界模型」將引領AI迎來新一波突破。

此理念已在行業內嶄露頭角,Google DeepMind的Project Astra即旨在打造跨多模態、能實時處理文本、音頻及影像的通用AI代理,實現自然對話和環境理解。

相較而言,Meta的AI主管Yann LeCun持類似觀點,但因無法與谷歌統一戰略,已宣布離職。谷歌則專注投入該路徑,同時維持現有聊天機器人技術的技術主體,並在技術格局上保持戰略多元。

Gemini系列的逆襲與組織整合

為在激烈競爭中勝出,谷歌CEO Sundar Pichai於2023年將兩大AI部門DeepMind與Google Brain合併,並由Hassabis領導。2024年8月,谷歌以27億美元重聘Transformer架構專家Noam Shazeer,他曾因拒絕擴散聊天機器人程序而離職,回歸後成功發現並修補Gemini的技術漏洞,顯著提升該系列模型的訓練效率。

Gemini 3模型在性能基準測試中超越ChatGPT,月活用戶達6.5億,谷歌搜尋用戶則突破20億,顯示其市場接受度持續提升。

儘管個別觀點存在分歧,Hassabis憑藉技術洞見和外交手腕,使谷歌重返AI競爭核心,被評價為學界關注科學與商業勝負平衡的重要人物。

尋找「殺手級」應用:智能眼鏡商業化大考

Gemini雖獲得階段性技術勝利,但谷歌仍面臨龐大商業化壓力。Gemini智能眼鏡預期2025年問世,承載廣告以外的變現願景。

該眼鏡將配置透明顯示屏,用作導航及翻譯等功能的輸出介面。關鍵在於若Hassabis成功將「世界模型」技術應用於此,眼鏡將具備記憶物品位置、理解3D環境及預測後續動態能力,遠超目前Meta Ray-Ban智能眼鏡僅能通過攝像頭識別場景的能力,後者未能深度處理物理環境資訊。

若此新品運作成功並獲得市場認同,不僅將洗刷谷歌現有智能眼鏡的聲譽頹勢,更有望成為AI領域真正的「殺手級」應用,確立谷歌在下一代計算平台中的領導地位。

Gemini 3系統性能與成本效益的突破

Gemini 3系列推出多個版本,包括近期發布的Gemini 3 Flash,以輕量級模型與高性能競逐市場。Flash版本在多模態理解和推理能力上,已接近甚至部分場景超越大型模型Pro版本,且其運行速度快了3倍,API成本只有Pro版本的約四分之一,成為高性價比代表。

根據最新測試,Gemini 3 Flash在GPQA及Humanity’s Last Exam等專業AI評估中均表現出色,尤其在多語言安全性和拒絕不當請求上優化明顯,保障用戶體驗。

相較OpenAI及Anthropic同類產品,Gemini 3 Flash憑藉速度、規模及成本優勢,展現了谷歌在AI技術商業化方面的競爭力。

谷歌Hassabis與DeepMind的科研成就

谷歌DeepMind共同創始人兼CEO Demis Hassabis憑藉在「深度強化學習」和AlphaFold蛋白質折疊預測系統的研究成果,與合作者獲得2024年諾貝爾化學獎,為谷歌帶來科學聲望。

Hassabis致力研發能整合多模態輸入的人工智能,推動谷歌AI在YouTube、Chrome、Android等產品中開創前沿應用,並預計於2025年底推出AI設計的藥物臨床試驗產品,開拓AI與生物醫藥交叉的新領域。

Meta Ray-Ban智能眼鏡功能對比

Meta於2023年9月發布Ray-Ban Meta智能眼鏡,第二代產品搭載Qualcomm Snapdragon AR1處理器、1200萬像素超廣角攝像頭及增強音效,支持直播Facebook與Instagram等社交功能。2024年改版引入多模態輸入及計算機視覺能力,提升AI性能。

該智能眼鏡通過Meta View手機App進行配對,整合Messenger、WhatsApp及Instagram,具備語音翻譯、導航及資訊查詢等多種AI助手功能,並保持Ray-Ban經典外型。雖有隱私風險引發關注,但依然是目前市面較為成熟的AI智能眼鏡方案之一。

總結

谷歌押注「世界模型」技術打造新一代智能眼鏡,標誌著AI技術由純語言處理向深度環境理解跨越。憑藉Gemini 3系統的加速發展及產品化潛力,谷歌有望在智能眼鏡市場與Meta等對手展開新一輪較量。

對投資者而言,關注谷歌及相關AI智能眼鏡產業鏈的新產品發展,將捕捉未來科技創新與商業化的機會。

參考資料:谷歌官方發布會及公開數據、DeepMind科技新聞、行業性能測評報告、Meta Ray-Ban官方資訊

市場重要性與影響評估: 高影響
影響範圍: 全球
影響時長: 中長期(3-12個月及12個月以上)
市場敏感度: 部分已反映但仍存在成長與競爭空間,市場期待值高

潛在市場影響:

  • Google藉由推出以「世界模型」技術為基礎的Gemini 3 AI智能眼鏡,標誌著AI智能眼鏡產業進入新一代技術突破階段,可能重塑智能穿戴設備的功能與應用範疇。
  • Gemini 3透過深度物理世界理解與多模態處理能力,將提升智能眼鏡在導航、翻譯、環境感知甚至3D物理互動的實用性,超越現有以影像頭識別為主的產品,帶動相關硬體與軟體生態系統的升級。
  • Google DeepMind及其CEO Demis Hassabis獲得2024年諾貝爾化學獎,強化Google AI技術與科研的權威性,有助於提升市場及投資者對Google AI戰略的信心。
  • Meta Ray-Ban智能眼鏡作為現有市場的成熟產品,面臨Google Gemini 3帶來的技術挑戰,兩者競爭將加速智能眼鏡市場的創新與產品多元化。
  • Gemini 3系列產品在性能、成本效益及多模態理解能力上均展現突破,有助於Google在AI商業化與市場占有率競爭中取得優勢,並吸引大量開發者及用戶生態系統。
  • Google將AI團隊整合入DeepMind,強化從研發到商業應用的全鏈條協同,預期將加速AI技術的產業化步伐,帶動相關產業鏈上下游發展。

風險:

  • 智能眼鏡市場仍處於早期發展階段,消費者接受度、隱私疑慮及技術成熟度均存在不確定性,可能影響新產品的市場滲透速度。
  • Gemini 3雖在多項AI評測中表現優異,但仍存在軟體錯誤及整合便利性等挑戰,若無法有效解決,可能影響用戶體驗及市場口碑。
  • Meta Ray-Ban智能眼鏡面臨歐洲GDPR等隱私監管壓力,類似規範可能波及整個智能眼鏡產業,增加合規成本與市場風險。
  • AI技術的快速演進帶來競爭壓力,Apple等其他科技巨頭的動向及策略調整,可能改變市場格局,對Google及Meta構成挑戰。
  • 高階AI模型的運算成本與能源消耗仍是長期挑戰,商業化推廣需平衡性能與成本效益。

其他觀點:

  • 部分業界專家認為Google Gemini 3的「世界模型」技術是AI發展的下一個重要里程碑,有望推動AI從純語言處理向深度環境理解跨越,開啟更多智能應用場景。
  • Meta前AI主管Yann LeCun離職反映企業內部對AI發展路線存在分歧,顯示AI競爭不僅是技術層面,也涉及組織策略與文化的調整。
  • 市場分析指出,Gemini 3的多版本策略(如Flash版、Pro版)有助於覆蓋不同用戶群體,促進產品快速迭代與市場擴展。
  • Google DeepMind團隊獲得諾貝爾獎提升了AI技術的學術與商業價值認可,預期將吸引更多資源投入AI研發與產業應用。

備註:

  • 本分析僅供參考,不構成投資建議。
風險提示及免責聲明
市場有風險,投資需謹慎。本文不構成任何個人投資建議,亦未考慮到個別用戶特殊的投資目標、財務狀況或需求。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定情況。據此投資,責任自負。