在 OpenAI 的「連續轟炸週」進行到一半時,谷歌也不甘示弱,深夜發布最新 AI 模型——Gemini 2.0,這款號稱「Agent 時代最強 AI 模型」的產品。
(前情提要:全鏈數據網路Chainbase整合Google Gemini:推動鏈上數據 AI 智慧化)
(背景補充:OpenAI 影片生成工具Sora正式上線!5大功能亮點、訂閱方案一次看)
在
OpenAI 的直播「連續轟炸」進行到一半時,Google 也不甘示弱於昨(11)日深夜發布最新 AI 模型— Gemini 2.0,與 OpenAI 和其他 AI 對手的較勁更加白熱化。
性能大幅提升
谷歌最新發布的 Gemini 2.0 系列 AI 模型,包括基礎版本「Gemini 2.0 Flash」和實驗版本,目前面向開發者免費開放試用,擁有文本轉語音、圖像生成等多模態功能。相比上一代,Gemini 2.0 的性能大幅提升:
- 速度提升兩倍:相比 Gemini 1.5 Pro,2.0 Flash 在速度和性能基準上均大幅超越。
- 多模態支持:提供文本、圖像、音頻等多元輸入,並實現多模態輸出,例如圖像與語音混合生成,大幅提升應用場景的創意空間。
- 工具整合:支持直接調用 Google 搜索、代碼執行與第三方函數,極大擴展實用性。
- 多步驟任務 AI Agent Project Mariner:完成多步驟的複雜任務。
- AI 程式設計 Agent Jules:直接整合 GitHub,長期目標是建構通用 Agent。
- 遊戲 Agent:電玩導航,根據遊戲動作推理、即時對話作為遊戲交流。
信息更加有用
Google CEO Sundar Pichai 在聲明中指出:「如果 Gemini 1.0 致力於組織和理解信息,那麼 Gemini 2.0 則旨在讓信息變得更加有用。」
Gemini 2.0 的應用涵蓋從代碼生成到複雜推理等多個領域,能提供更高效、更精準的回應。特別是在 Chat 模式中,使用者可以通過 Google AI Studio 和 Vertex AI 平台,探索其強大的能力。
基於 TPU 的計算優勢
Gemini 2.0 建立在 Google 自研第六代 TPU(Tensor Processing Unit)架構之上,該硬體平台專為 AI 訓練與推理設計,能提供高效能與低延遲的運算支持。
TPU 的優勢在於:
- 在深度學習任務中具有更高的能效比;
- 實現大規模模型訓練的硬體最佳化;
- 被廣泛應用於 Google Pixel 手機與 AI 伺服器,構建 AI 生態。
TPU 是被設計並運用於大量的低精度計算。Google 於研究表明在使用神經網路推斷的 AI 運算任務中,TPU 的效能是當代 GPU 和 CPU 的 15 到 30 倍。相比之下,OpenAI 所倚重的 GPU 基礎架構,儘管性能領先,但在特定場景中仍可能被 TPU 超越。
OpenAI 的直接威脅?
Gemini 2.0 的發布,標誌著 Google 在 AI 軍備競賽中向 OpenAI、Perplexity 和 Anthropic 等對手發起正面挑戰。儘管近幾個月來,OpenAI 在 ChatGPT 和 GPT-4 的迭代上處於領先地位,但業內專家指出谷歌採取的「免費試用」策略,對開發者形成極大吸引力,同時也為 OpenAI 帶來了不小的壓力。
在《紐約時報》DealBook 峰會上,當谷歌 CEO Sundar Pichai 被問及如何看待微軟在人工智能領域的進步時,他毫不掩飾自己的信心:
「我隨時都很樂意對兩家公司的模型進行並排比較。」
📍相關報導📍
全鏈數據網路Chainbase整合Google Gemini:推動鏈上數據 AI 智慧化