不讓 DeepSeek、OpenAI 專美於前,Google 12 日推出可以在單一 H100 GPU 或 Google TPU 上運行的地表最強 AI 模型 Gemma 3,性能表現超越了 DeepSeek v3、OpenAI o3-mini 和 Meta 的 Llama3 ,引爆全球關注。
(前情提要:輝達財報營收成長114%超預期,黃仁勳為何不畏 DeepSeek 衝擊?)
(背景補充:Deepseek 利潤率 545%「估市值破百億」?彭博開酸:理論值、使用者不一定想付費 )
中國人工智慧新創公司 DeepSeek 年初推出開源大型語言模型 DeepSeek V3 和 R1,在 AI 領域打響了「低成本」、「開源」的輕量級模型戰爭,2月 OpenAI 緊急免費推出該公司最具成本效益的輕量級推理模型 o3-mini 應戰。
另一家 AI 巨頭 Google 本週也推出只需「1 個 」H100 晶片就能高效運行,號稱「全球最強單加速器模型」的Gemma 3。該模型也是 Google 開放模型 Gemma 系列中最強大、最新的版本。
透過針對輝達 GPU 和專用 AI 硬體的優化,Gemma 3 能夠在單顆晶片,如輝達的 H100 或 Google 的 TPU 上高效運行。 在 LMArena 基準測試中,Gemma 3 超越了 DeepSeek v3(32 個 H100)、OpenAI o3-mini 和 Meta 的 Llama3(16 個 H100)等競品,是可以在單一 GPU 或 Google TPU 上運行的地表最強模型,發布後迅速引爆全球關注。

Gemma 3 引進多模態
根據 Google 介紹, Gemma 系列模型過去一年以已達到超過 1 億次的下載量,並在「Gemmaverse」中衍生出 6萬多種變體,供開發人員使用,其設計目標是「直接在從手機、筆電到工作站等任何裝置上快速運行」。
最新的 Gemma 3,添加了社群敲碗最多的更長的上下文、多模態等功能,可分析圖像、文字與短影片,支援視覺語言輸入和文字輸出,並理解 140 多種語言,提供改進的的數學、推理和聊天功能。Gemma 3 也提供四種不同的尺寸(1B、4B、12B 和 27B),滿足開發人員的需求。
衝擊輝達高階晶片需求?
值得注意的是,據報導,Google 的 Gemma 3 對輝達在 AI 硬體市場主導地位構成挑戰, Google 正透過打造可在多種硬體平台,甚至單晶片也能高效運行的模型,尋求減少對輝達高階 GPU 的依賴。
隨著 DeepSeek 、 Gemma 3 等這類高成本效益的模型的問世,意味著開發者和用戶將可投入更少的 GPU 成本。恐影響輝達的高階晶片出貨量,此外,Google TPU 等替代硬體積極發展,再加上類似 Gemma 3 等優化模型陸續推出,目前輝達因為在 AI 訓練和推理方面的優勢而形成的 80% 市佔壟斷地位,在未來恐遭逐步打破。
📍相關報導📍
Google Gemini 2.0 來了!三款模型差異一次看、免費開放更強推理能力 Flash Thinking 試用
被DeepSeek逼急?OpenAI免費上線新推理模型o3-mini!Altman首度承認:閉源策略錯了