OpenAI 推出最新模型 GPT-4o mini,以更快速、更便宜及更聰明的小型模型淘汰了 GPT-3.5。以下整理 GPT-4o mini 有哪些優勢?
(前情提要:最高等AI有多恐怖?OpenAI劃分五級,透露ChatGPT連第2級都不到 )
(背景補充:OpenAI遭駭》Tether執行長:正打造去中心化AI模型,目標在手機就能運算 )
你有發現 ChatGPT 使用介面中,今天新增了 GPT-4o mini,而 GPT-3.5 已被淘汰了嗎?OpenAI 最新推出的迷你模型 GPT-4o mini,號稱能更快速、更便宜及更聰明的取代 GPT-3.5,即時是免費版用戶也能使用,並稱將於今年秋天與蘋果個人智慧系統 Apple Intelligence 結合,在 iPhone 等裝置運行。
OpenAI 表示,GPT-4o mini 在多項任務上表現優於 GPT-3.5 Turbo,包括文本處理、多模態推理和數學編碼能力。
We’re continuing to make advanced AI accessible to all with the launch of GPT-4o mini, now available in the API and rolling out in ChatGPT today. https://t.co/sTxtOfUapJ
— OpenAI (@OpenAI) July 18, 2024
GPT-4o mini 的優勢一次看
在 LMSYS 排行榜中,GPT-4o mini 與 GPT-3.5 Turbo 相比,前者提高閱讀性能,具有 12.8 萬個 token 的上下文窗口,且支援每個請求最多 1.6 萬個輸出 token。在多個關鍵基準測試上,GPT-4o mini 皆表現出色,這包含有:
- 推理任務表現:GPT-4o mini 在涉及文字和視覺的推理任務上優於其他小型模型,在 MMLU(大規模多任務語言理解)上得分為 82.0%,優於 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。
- 數學和編程能力:
- GPT-4o mini 在測量數學推理的 MGSM 上,得分為 87.0%,優於 Gemini Flash 的 75.5% 和 Claude Haiku 的 71.7%。
- 此外,GPT-4o mini 在衡量編碼表現的 HumanEval 上得分為 87.2%,優於 Gemini Flash 的 71.5% 和 Claude Haiku 的 75.9%。
- 多模態推理:GPT-4o mini 在評估多模態推理的 MMMU 上得分為 59.4%,優於 Gemini Flash 的 56.1% 和 Claude Haiku 的 50.2%。
GPT-4o mini 知識截至 2023 年 10 月,並支援與 GPT-4o 相同範圍的語言,雖然目前 GPT-4o mini 僅支援文字的輸入和輸出(API 已有視覺能力),但 OpenAI 表示未來將支援圖像、影片和音訊。
GPT-4o mini 更便宜
在價格方面,GPT-4o mini 每百萬個輸入 token(約相當於一本標準書的 2500 頁)定價 15 美分,每百萬個輸出 token 定價 60 美分,這比市場現有的模型便宜一個數量級,並且比 GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini 已經在 Assistant API、Chat Completions API 和 Batch API 中推出,並且已經供 ChatGPT 的免費、Plus 和 Team 用戶使用,企業用戶將在下週獲得使用權。
GPT-4o mini 更安全
另外,OpenAI 強調安全性是其模型開發過程中的重點,從預訓練到訓練後,都通過過濾不適合的資訊和使用人類回饋的強化學習(RLHF)等技術來使模型行為與政策保持一致,以提高模型回應的準確性和可靠性。
OpenAI 表示,GPT-4o mini 擁有與 GPT-4o 相同的安全措施,經過自動化和人工評估嚴格檢測,以遵循其預備框架和自願承諾。
在增強安全性上,GPT-4o mini 是第一個在 API 中應用「指令層級方法」的模型,有效提高了模型對抗非法破解、提示注入及系統提示提取的能力,使得它的回答更加可靠,也讓它在大規模應用中的使用更安全。
應用案例
OpenAI 表示,GPT-4o mini 以其低成本和低延遲支援廣泛的任務,例如:
- 連結或並行化多個模型呼叫,例如:調用多個 API
- 提供大量上下文資訊,例如:完整程式碼庫、對話歷史記錄
- 透過快速、即時的文字回應與客戶互動,例如:客服聊天機器人
OpenAI 最後承諾,將持續推動成本下降和模型能力增強的趨勢,並致力於使 AI 更加普及和可靠。
📍相關報導📍
種子輪就拿8500萬美元,AI新星Sentient憑什麼喊能擊敗OpenAI?
整合ChatGPT後》蘋果將加入OpenAI董事會,與微軟平起平坐,未來衝突難免?
傳統新聞末日?時代雜誌合作OpenAI,百年資料全給ChatGPT訓練