OpenAI 宣布其開源 Agents SDK 支援 MCP 協議,開放開發者串接外部工具與資料,讓 AI 能真正「動手做事」。此舉顯示業界對 MCP 的重視。
(前情提要:串聯萬物的 MCP 加上 Web3,能成下一波 AI 百倍敘事嗎?)
(背景補充:OpenAI 新推最強生圖模型:精準製作資訊圖表、多模態輸入、品質逼真難辨,內建於GPT-4o)
OpenAI 繼昨日推出 GPT-4o 的圖像生成功能,引發社群一片好評後,今日再宣布重大進展,其開源代理人工具 Agents SDK 現已支援 MCP(Model Context Protocol, 模型上下文協議),標誌著 AI 模型互操作性的發展邁出關鍵一步。
這項更新立馬引起社群熱議,顯示業界對 MCP 的重視,並認為 OpenAI 的支持是對這一標準的ㄧ大認可。
MCP 🤝 OpenAI Agents SDK
You can now connect your Model Context Protocol servers to Agents: https://t.co/6jvLt10Qh7
We’re also working on MCP support for the OpenAI API and ChatGPT desktop app—we’ll share some more news in the coming months.
— OpenAI Developers (@OpenAIDevs) March 26, 2025
MCP 是什麼?讓 AI 擁有「外接大腦」與「操作手」
MCP,全名為「Model Context Protocol(模型上下文協議)」,最初由 Anthropic 於 2024 年 11 月提出並開源,核心目標是打通 AI 模型與外部世界的資料與工具整合界面。
傳統語言模型如 ChatGPT 雖有強大語言能力,但無法直接存取使用者裝置、資料庫或第三方服務。MCP 設計一套標準化溝通方式,讓大型語言模型(LLMs)可依照明確規則,安全地讀取外部數據(比如你的 Excel 表)、用工具(比如 GitHub 的 API),甚至自己動手做事(比如跑個 Linux 命令)。
開發者圈以「AI 的 USB 插槽」來形容 MCP 的角色。它讓 AI 從只能對話的虛擬助手,進化為能動手做事、執行任務的行動代理。
OpenAI 支援 MCP
如今,OpenAI 宣布其 Agents SDK 現已支援 MCP,使得開發者可直接透過 MCP 協議,將外部服務串接進 Agents 系統中,實現資料讀取、API 操作、指令執行等功能,大幅擴展 OpenAI 代理人的實用性,像是可以整合網路搜尋、專業分析、本地查詢等各式各樣的 MCP 工具。
OpenAI 同步預告未來將擴大 MCP 支援範圍,包含:
-
開放 OpenAI API 直接支援 MCP;
-
在 ChatGPT 桌面版加入 MCP 功能。這可能會在前端新增「MCP 工具市場」,讓用戶挑選想用的工具或服務(像連接 Notion 的 MCP 插件)。
此舉意味著不僅開發者能更靈活構建 AI 代理,普通用戶也將更直接地受益於 MCP 所帶來的「全能助理」體驗。
Agents SDK 是開源的,且釋出 MCP 實作方法
值得注意的是,OpenAI Agents SDK 本身採 MIT 許可證,屬於開放性最高的自由軟體授權類型。開發者可任意修改、商用、再發行。此次新增支援的 MCP 同樣為開源專案,全球開發者可據此打造符合 MCP 標準的智慧代理服務,擴展 AI 應用邊界。
具體而言,官方 GitHub 倉庫連結介紹了兩種類型的 MCP 伺服器:
-
標準輸入輸出(stdio)伺服器:作為應用程式的子程序運行,類似於在本地執行。
-
基於 HTTP 的伺服器:透過 URL 連接,適用於遠端伺服器。
此外,還提供了如何將 MCP 伺服器整合到 Agents 中的範例,以及關於工具列表快取和追蹤(tracing)的相關資訊,為開發者在 Agents SDK 中實作 MCP 提供了全面的技術支持。
其他 LLM 支援 MCP 的狀況
目前,支援 MCP 的平台包含 Anthropic 自家推出的 Claude 模型、開源多模型聊天平台 LibreChat 和開發者導向的編輯器 Zed 等。
如今,隨著 OpenAI 加入 MCP 的行列,說明這個標準越來越受歡迎,可能會成為 AI 行業的「通用插頭」,讓不同 AI 和工具更容易合作,並吸引 Google Gemini、Meta LLaMA、xAI Grok 等 LLM 正式支援 MCP。
📍相關報導📍
打破輝達壟斷? Google地表最強AI模型「Gemma 3」用1顆H100,擊敗DeepSeek、OpenAI