OpenAI 正式推出完整版推理模型 o1,取代先前的預覽版,提供更快、更準確的推理能力,特別在程式設計、數學和寫作方面表現卓越。另外還推出 ChatGPT Pro 訂閱方案,月費 200 美元,提供獨享的升級版 o1 Pro。
(前情提要:OpenAI 宣布將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏?)
(背景補充:能像人類一樣思考!OpenAI o1 新模型亮相:數理、編程能力大幅躍進)
ChatGPT 背後開發商 OpenAI 昨(5)日預告,將於今日凌晨 2 點開始進行為期 12 天的新產品發布,首日登場的是完整版推理模型 o1,取代先前的預覽版,目前 ChatGPT Plus、Team 和 Pro 用戶已可以使用(企業和教育用戶則將在一周內獲得使用權限)。
直得注意的是,OpenAI 推出新的訂閱方案「ChatGPT Pro」,月費 200 美元能無限制使用 o1 模型、高級語音模式以及獨享升級版 o1「o1 Pro」。該模型可以進行更長時間的思考,從而提供更可靠的回應。
完整版 o1 模型回應更快、支援圖片推理
OpenAI 的發言人表示,OpenAI 在 9 月發布了 o1 的預覽版,而這個新版本,總的來說,性能更高。
與預覽版相比,使用者可以期待更快、更強大、更準確的推理模型,在程式設計、數學和寫作方面好得多。在國際奧林匹克數學競賽的測驗中,o1 模型得分達到 83%,遠高於 4o 版本的 13%。
此外,o1 現在可以對上傳的圖片進行推理(這在預覽版是不行的),並且已經被訓練為「更簡潔的思維」以縮短回覆時間。官方表示,o1 比 o1-preview 表現更出色,特別是在應對複雜現實問題時,重大錯誤的發生率降低了 34%。
不過,據官方文檔顯示,o1 在部分常見基準測試中的表現比預覽版差,像是機器學習工程(MLE)、某些代理任務的執行(如啟動 Docker)等。
在安全性方面,OpenAI 表示,最新 o1 system card 基於先前的安全工作進一步改進,涵蓋穩健性測試、紅隊模擬(Red Teaming)測試,以及透過指令層級結構提升系統的安全性。經過全面的測試評估後,雖然 o1 系統仍被評為「中等風險」,但結果顯示其已具備足夠的安全性,可以投入實際應用。
註:o1 和其他推理模型與一般 AI 模型的不同之處在於,它們會在執行任務時檢查自己的工作,以避免常見錯誤。雖然這可能會導致解答過程花費更多時間,但它們能通過推理和提前規劃,從而更精確地解決問題。
o1 Pro 撰寫程式更強
對於推出昂貴的 ChatGPT Pro 訂閱方案,OpenAI 技術人員 Jason Wei 在週四的直播新聞發佈會上表示:
我們認為 ChatGPT Pro 的受眾將是 ChatGPT 的高級使用者——那些已經在數學、程式設計和寫作等任務上將模型推向極限的人。
在 Pro 用戶獨享的「o1 Pro」模型性能上,OpenAI 發言人表示,在外部專家測試者的評估中,o1 Pro 能更穩定地生成準確且全面的回應,特別是在數據科學、編程和案例法分析等領域。
「與 o1 和 o1-preview 相比,o1 pro 在數學、科學和程式設計等高難度的機器學習基準測試中表現更佳,尤其是在較基礎的編程競賽問題(更接近日常程式設計需求)上,錯誤率降低了 75%。」
下一步,OpenAI 表示 o1 將支援網頁瀏覽和檔案上傳等功能,並提供 o1 API,支援函數呼叫、開發人員訊息和結構化輸出等。
📍相關報導📍
ChatGPT被爆「拒絕回復David Mayer」等人名,OpenAI遭疑刻意封鎖資訊
馬斯克申請禁令「阻止OpenAI轉型營利企業」羅列四大罪狀:壟斷AI市場、圖利微軟…
OpenAI 驚爆 2018 原計畫「ICO 發幣」!但遭馬斯克一理由否決