真正 DeFai 願景的實現需要解決單體 AI 模型能力上限、多模態交互協作原子性保證、多模態系統統一資源調度和支配、系統容錯和故障處理機制等等覆雜問題。本文源自 鏈上觀 所著文章,由 PANews 整理、編譯。
(前情提要: 中國「Manus」通用型AI代理人爆紅!能開發網頁、分析股票、找房子勝過OpenAI,邀請碼炒到20萬天價)
(背景補充: 幣安報告:DeFAI 如何重塑 DeFi 互動體驗?)
一覺睡醒,好多朋友讓我看 #manus,號稱一款全球真正意義上通用的 AI Agent,能夠實現獨立思考並規劃執行復雜任務,並交付完整結果。聽起來非常 Cool,但除了很多朋友圈焦慮的要失業的聲音之外,它會給 web3 DeFai 場景大爆發帶來什麼?
以下,談談我的思考:
1)約一個月前 OpenAI 推出了同類別產品 Operator,AI 可以在瀏覽器中獨立完成包括餐廳預訂、購物、訂票、外賣訂餐等任務,使用者可以視覺化進行監督,並隨時接管控制權。
這套 Agent 的出現並沒有多少人討論,原因在於它是單一模型驅動,還是工具呼叫的那套框架,使用者一想到關鍵決策還需要干預進行就失去了依賴其執行任務的想法。
2)manus 表面看似也差不太多,只是多了不少應用場景,包括篩選簡歷,研究股票、購買房產等等,但實際上是背後的框架和執行系統差異,Manus 由多模態大模型驅動,並創新性的採用了多重簽名系統。
簡而言之,AI 要模仿人執行(計劃 – 執行 – 檢查 – 行動)的 PDCA 迴圈行動,將由多個大模型共同協作完成,每個模型專注於特定環節,既能降低單個模型執行任務的決策風險,又能提高執行效率。所謂「多重簽名系統」其實是多模型協作的決策驗證機制,通過要求多個專業模型的共同確認來保證決策和執行的可靠性。
3)如此一比較,manus 的優勢顯然就凸顯出來了,加上視訊 Demo 裡展現的一系列操作體驗,讓人確實有一種非凡的體驗感。但客觀來說,Manus 對 Operator 的迭代創新只是個開始,還達不到顛覆性革命意義。
web3 的 DeFai 應用
關鍵點就在於其執行任務的複雜程度,以及非統一標準使用者 input Prompt 進入之後大模型的容錯率和交付結果成功率定義。要不然,順著這套創新,web3 的 DeFai 場景是不是立馬就可以成熟應用了?顯然,還做不到:
比如:DeFai 場景下 Agent 要執行交易決策,需要有一個 Oracle 層的 Agent 負責鏈上資料收集和驗證,並進行資料整合分析,還要即時監控鏈上價格捕捉交易機會,這個過程對即時分析有很大挑戰,有可能一秒前還有用的交易機會,等 Oracle 大模型傳輸給交易執行 Agent 之後,交易機會就不存在了(套利窗口);
這其實暴露了這類多模態大模型做執行決策的一個最大軟肋,如何聯網、觸鏈調取分析 Real-Time 級別的資料,並從中分析出交易機會,然後進行交易捕捉。聯網環境其實還好,很多電商網站的訂單價格並非即時變動,不容易給整個多模態協作造成巨大動態平衡困擾,要是在鏈上,這樣的挑戰幾乎無時無刻存在。
4)所以,整體上 manus 的出現確實會在 web2 領域掀起一波朋友圈焦慮,畢竟很多重複性高的文職和資訊處理工種可能會面臨被 AI 取代的風險。但讓他們焦慮他們的。
這事放在 web3 對 DeFai 應用場景的推動作用我們得客觀認識:
必須得承認:意義肯定重大,畢竟它提出的 LLM OS 以及 Less Structure more intelligence 理念、尤其是多重簽名系統會給 web3 拓展 DeFi 和 AI 的結合有很大的啟迪思路。
這其實糾正了大部分 DeFai 專案的重大誤區,不要上來就想依靠一個大模型實現 AI Agent 自主化思考 + 決策等複雜目標,這在金融場景下,根本不切合實際。
真正 DeFai 願景的實現需要解決單體 AI 模型能力上限、多模態互動協作原子性保證、多模態系統統一資源排程和支配、系統容錯和故障處理機制等等複雜問題。
比如:Oracle 層 Agent,負責收集鏈上資料和分析,並監控價格,形成有效資料來源;
決策層 Agent,根據 Oracle 餵過來的資料進行分析和風險評估,並制定一套決策和行動方案;
執行層 Agent,根據決策層給出的多種方案,並考慮實際情況進行執行,包括 gas 費用優化、跨鏈狀態、交易排序衝突等等。
唯有這一系列的 Agent 都同步強大,並有一個龐大的系統框架落定,一個真正的 DeFai 革命才會掀起。