OpenAI 更新 GPT-4o,強化指令理解、編碼能力與創造力,在 LMArena 排行榜超越 GPT-4.5 躍居第二名,並以十倍性價比成為新焦點。
(前情提要:OpenAI 重磅宣布:開放 Agents SDK 支援 MCP,串聯萬物再跨關鍵一步)
(背景補充:OpenAI 新推最強生圖模型:精準製作資訊圖表、多模態輸入、品質逼真難辨,內建於GPT-4o)
OpenAI 繼推出 GPT-4o 的圖像生成功能、Agents SDK 支援 MCP 協議,引發社群一片好評後,今日再度釋出 GPT-4o 的重大更新,強調其在編碼、創造力和指令處理能力有顯著提升。此版本現已對所有付費 ChatGPT 用戶開放,免費用戶則預計於未來數週陸續取得使用權。
GPT-4o got an another update in ChatGPT!
What's different?
– Better at following detailed instructions, especially prompts containing multiple requests
– Improved capability to tackle complex technical and coding problems
– Improved intuition and creativity
– Fewer emojis 🙃— OpenAI (@OpenAI) March 27, 2025
GPT-4o 更新內容
根據 OpenAI 官方說明,GPT-4o 此次更新在多指令處理、複雜編碼任務與直覺推理方面皆有所強化,具體四點為:
-
更擅長遵循詳細指令,特別是包含多個請求的提示。
-
提升了解決複雜技術和編碼問題的能力。
-
增強了直覺和創造力。
-
減少了表情符號的使用 。
執行長 Sam Altman 在個人 X 帳號表示,這次更新是「巨大的進步」,新版的 GPT-4o 特別擅長編碼、指令遵循,且自由度大幅提升,並預告未來還有更多更新。
模型超越 GPT-4.5 排名第二
根據 LMArena(開放式平台,由社群共同評比全球 LLM 的效能與表現)公布的最新測評結果:
- 最新版本的 GPT-4o 在 LMArena 排名從第五躍升至第二,比 1 月版本提升了 30 分,超越 GPT-4.5。
- 在編碼與高難度提示(Hard Prompts)方面與 Google Gemini 2.5 Pro 並列第一
- 在所有類別中排名前二
- 比 GPT-4.5 便宜 10 倍,但性能更強。
News: the latest ChatGPT-4o (2025-03-26) jumps to #2 on Arena, surpassing GPT-4.5!
Highlights
– Significant improvement over the January version (+30 pts, #5->#2)
– Tied #1 in Coding, Hard Prompts. Top-2 across ALL categories
– Matching or surpassing GPT-4.5 with 10x cheaper… https://t.co/m5jQ0BXffV pic.twitter.com/3NK7Eh6Ri8— lmarena.ai (formerly lmsys.org) (@lmarena_ai) March 27, 2025
社群回響熱烈,API 更新備受期待
此次更新引起廣泛社群討論,網友如 McKay Wrigley 表示 GPT-4o 是「絕對的樂趣」,再度成為日常對話首選。
同時不少開發者詢問是否有 API 更新。 對此,OpenAI 宣布已同步釋出 API 更新版本「chatgpt-4o-latest」,並表示將於未來幾週推向更多既有 API 模型。
`chatgpt-4o-latest` is now updated in the API, but stay tuned—we plan to bring these improvements to a dated model in the API in the coming weeks. https://t.co/YS0chKmIag
— OpenAI Developers (@OpenAIDevs) March 27, 2025
然而,亦有大量使用者針對 GPT-4o 與 GPT-4.5 的定位表達困惑,詢問「GPT-4o 和 GPT-4.5 在哪些任務上有所區別,應該如何選擇使用?」、「GPT-4o 是否已經超越 GPT-4.5?」等問題。
同時,不少用戶提出仍偏好「表情符號」,顯示 OpenAI 在模型個性設定上仍需平衡多元使用習慣。
隨著 OpenAI 更新節奏加快,AI 顯然已進入持續迭代與競速的新階段。
📍相關報導📍
打破輝達壟斷? Google地表最強AI模型「Gemma 3」用1顆H100,擊敗DeepSeek、OpenAI