由中國新創 DeepSeek 發表的 AI 模型近期爆火,今日登頂美中的蘋果 iOS 應用商店免費榜冠軍,透過僅花不到 600 萬美元的成本打造出能與 ChatGPT 和 Meta Llana 相抗衡的模型,該公司已引起了 Meta 創辦人祖克柏的忌憚。
(前情提要:ChatGPT o3-mini 即將發布!OpenAI 產品長加碼:Q1 上線 AI Agents 工具 )
(背景補充:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? )
去年聖誕節隔日,中國一家總部位於杭州的人工智慧實驗室深度求索(DeepSeek)推出了一個免費開源大型語言模型 DeepSeek-V3,向全球科技圈拋下震撼彈,一夜爆紅,並成為近期市場焦點。
究竟為何 DeepSeek 引起了矽谷 AI 巨頭微軟、Meta 等公司的忌憚?簡單來說,是因為其據稱僅花費不到 600 萬美元、使用的是 Nvidia 性能較低的 H800 晶片,且僅僅耗時 2 個月就成功打造出性能媲美甚至超越美國市面上最強大模型的 DeepSeek-V3。
DeepSeek 僅花 560 萬美元打造超越 ChatGPT、Llama 模型
據 CNBC 報導,在一組第三方基準測試中,DeepSeek 的模型準確度表現,從複雜問題的解決,到數學和編寫程式碼等方面,皆優於 OpenAI 的 GPT-4o、Meta 的 Llama 3.1 和 Anthropic 的 Claude Sonnet 3.5。
不到 1 個月,1 月 20 日,DeepSeek 最新推出的「DeepSeek-R1」推理模型在許多第三方測試中也優於 OpenAI 最新的 o1 模型。
知名 AI 系統排名網站 Chatbot Arena 顯示,「DeepSeek-R1」在整體榜單上排名第三,並與 OpenAI 推出的頂尖推理模型 o1 並列在風格控制類型(StyleCtrl)模型的第一;DeepSeek-V3 則在總榜中排名第八,在開源模型中居冠,還是前十名中性價比最高的模型。
DeepSeek-V3 僅花費不到 560 萬美元成本建置 ,相較於 OpenAI 、Google、微軟等公司每年動輒數十億甚至數百億美元的訓練成本,可說是說是在成本效益方面做到了飛躍性的突破,引爆了矽谷 AI 公司恐慌。
美股科技股受挫,輝達週五跌超 3%
DeepSeek 同時也敲響了人們的警鐘:即美國在 AI 領域的全球領先地位是否正在被中國急起直追,並讓人們對大型科技公司在建立 AI 模型和資料中心方面的數千億美元巨額支出提出質疑。
市場上甚至有人將輝達上周五股價大跌 3.12% 的原因歸因於 DeepSeek 的爆紅,認為 DeepSeek 對美股可能是最大威脅。彭博今日報導,由於 DeepSeek 引發了人們對美國科技主導地位的質疑。美國股指期貨週一亞洲早盤重挫。
延伸閱讀:OpenAI、軟銀、甲骨文啟動史上最大 AI 基建計劃「Stargate Project」:投資 5000 億美元在美設資料中心
DeepSeek引發Meta內部恐慌,祖克柏警告:中美 AI 差距非常小
《Information》爆料,DeepSeek 的飛速進展已讓 Meta 的 AI 團隊陷入恐慌模式,擔憂 Meta 旗艦 Llama 模型下一版本可能無法與 DeepSeek 相抗衡,落後於 AI 競賽中,甚至傳出 Meta 已經成立 4 個戰情室研究 DeepSeek 的運作方式。OpenAI 等其他頂級 AI 公司的研究人員也正在全力分析 DeepSeek 模型,希望在成本效率方面尋獲可借鑑之處。
Meta 執行長祖克柏也在近期公開點名 DeepSeek 是非常先進的模型,「AI 競賽是一場全球地緣政治的戰爭,現在中美差距非常小」,並呼籲美國政府別拖後腿,給予美國公司更多支持,別把現在的領先地位當成理所當然的事。
微軟執行長納德拉 (Satya Nadella) 也對 DeepSeek 新模型表示印象深刻,稱讚他們真正有效地完成一個開源模型,進行推理時間計算,並且具有超級計算效率,「我們應該非常非常認真地對待中國的事態發展。」
Midjourney 創辦人讚 DeepSeek 中英文能力都很強
AI 繪圖工具 Midjourney 創辦人最近在經實測後也大讚 DeepSeek 的中、英文能力出色,他昨日發推指出:
deepseek 在中國古代哲學和文學方面碾壓了西方模型,同時對英語的掌握也比我的第一手中文資料強得多。感覺就像跨世代交流我以前從未接觸過的文學/歷史/哲學知識,這是相當令人感動的,也是有道理的。
西方實驗室不關心中國數據的培訓(但中國實驗室對兩者都進行培訓)。請記住,中國比西方有幾千年的文學史(因為我們失去了大部分羅馬/希臘/埃及文學,而中國保留了他們的文學)。
基本上,我們的模型缺乏西方思想的文學基礎,但中國的模型卻完好無損。這既可能「資料優勢」,也可能是精神和哲學自我實現上不太明顯的優勢。
登頂美中蘋果 iOS 免費榜
值得注意的是,DeepSeek 也正迅速吸引大量用戶,其應用程式以登頂蘋果美國和中國區的應用商店免費下載排行榜,在美區超越了 ChatGPT,這可謂是一大創舉,成為繼 Tiktok 後另一個在美國爆火的中國現象級應用。
🚨🇺🇸 DEEPSEEK OVERTAKES CHATGPT IN APP STORE RANKINGS IN THE U.S.
Chinese AI platform DeepSeek has reportedly surpassed OpenAI’s ChatGPT on Apple’s App Store rankings just a week after launch.
Developed by Hangzhou-based DeepSeek, the platform offers advanced reasoning and… https://t.co/kXInxTNr2k pic.twitter.com/6XPBRiLejO
— Mario Nawfal (@MarioNawfal) January 27, 2025
📍相關報導📍
OpenAI 最強模型 o3「遭爆作弊」疑用特權提前獲測試答案,數學能力造假?
17歲高中生寫出「神級Prompt」強化Claude推理能力媲美o1模型,如何實現?