ChatGPT 開發商 OpenAI 在月初宣布面向 Pro 用戶推出全新 AI 代理功能 Deep Research 後,在 26 日宣布向所有付費用戶全面開放,同時,微軟今日開源多模態 AI 代理基礎模型 Magma ,可處理文字、圖像和影片等多模態數據。
(前情提要:OpenAI反制馬斯克惡意收購!擬予非營利董事會「特殊投票權」防惡意收購)
(背景補充:馬斯克開價974億鎂收購OpenAI!Sam Altman秒拒反嗆:那我用97.4億鎂買X(Twitter))
中國 AI 新創公司 DeepSeek 本周啟動啟動「 開源周」活動,陸續開源五個程式碼庫,以完全透明的方式分享研究進展,值此之際,OpenAI 等競爭對手積極提升其技術實力,不僅推出強化功能來提升模型表現,還在部分領域加速推動開源計畫。
OpenAI 在月初宣布推出全新 AI 代理功能 Deep Research ,開放給 Pro 用戶使用,該功能能在網路上執行多步驟研究,專為複雜的任務設計,可在短短幾十分鐘內,完成本來需要數小時的人工作業。
用戶只需提供一個提示,ChatGPT 便會搜尋、分析並綜合數百個線上來源,最終產出一份具有專業水準的完整報告,該功能由 OpenAI 的 o3 模型特製版本驅動,針對網頁瀏覽與數據分析進行優化,利用推理能力來搜尋、解讀並分析大量線上文本、圖像及 PDF,並能根據發現的新資訊,靈活調整研究方向。
OpenAI 向 Plus 等用戶推出 Deep Research 功能
而如今 OpenAI 在 26 日進一步公告,Deep Research 功能現已向 ChatGPT Plus、Team、Edu 和 Enterprise 用戶全面開放,Deep Research 功能進行了一些改進,像是可嵌入帶有引文的圖片,以及優化對上傳檔案的理解和引用能力。
Since the initial launch, we’ve made some improvements to deep research:
✅Embedded images with citations in the output
✅Better at understanding and referencing uploaded files
— OpenAI (@OpenAI) February 25, 2025
Plus、Team、Enterprise 和 Edu 用戶每月將可使用 10 次 Deep Research 功能 ・Pro 用戶每月則可使用 120 次,OpenAI 同時發布系統卡,介紹 Deep Research 功能的開發、能力評估和安全改進,並邀請專家參與未來模型的訓練。
微軟開源多模態 AI 代理基礎模型 Magma
另外,微軟今日在官網開源多模態 AI 代理基礎模型 Magma・相較於傳統代理,Magma 有跨數位、物理世界的多模態能力,能自動處理圖片、影像、文字等不同類型的數據,此外,Magma 還內建心理預測功能,增強對未來畫面時空變化的理解的理解能力,能準確推測影片中人物或物體的行動和未來意圖。
使用者可以利用 Magma 來執行各種自動化任務,例如線上購物下單、查詢天氣,甚至能遠端控制實體機器人,在真實棋局中提供決策建議,協助使用者更有效下棋。
根據微軟官方介紹,Magma 能幫助 AI 驅動的助手或機器人理解周遭環境並採取適當行動,例如可讓家用機器人學習如何整理從未接觸過的物品,或協助虛擬助手針對陌生的操作任務生成詳細步驟引導指引。
作為一款 VLA(視覺 – 語言 – 動作)基礎模型,Magma 能適應數位與物理環境中的新挑戰,從龐大的公開視覺和語言資料中學習知識,透過融合語言理解、空間感知與時間推理能力,該模型能處理各種複雜場景,無論是在虛擬世界還是真實環境中,都能發揮強大的智慧應用價值。
📍相關報導📍
OpenAI 首款自研發 AI 晶片料今年完成設計交由台積電試產,能制衡輝達霸主地位?