Agent 不僅將改變人們與電腦的互動方式,還將顛覆軟體行業,引發自從我們從鍵入命令到點選圖示以來電腦領域的最大革命。下文源自比爾蓋茲部落格文章,由 Foresight News 整理與編譯。
(前情提要:a16z萬字長文:金融服務如何利用「生成式 AI(Generative AI)」? )
(背景補充:ChatGPT之父Sam Altman:美國政府正對加密貨幣發起戰爭、想「掌控」比特幣 )
保羅・艾倫和我一起創立微軟的至今,我對軟體的熱愛至今依然不減。然而,儘管在過去的幾十年中軟體已經取得了很大進步,但在很多方面,軟體還是顯得相當「笨拙」…比爾蓋茨這樣說道。
在電腦上執行任何任務,你都需要指定要使用的應用程式。雖然你可以使用微軟 Word 或 Google 文件來撰寫商業提案,但這些工具無法幫助你傳送電子郵件、分享自拍、分析資料、安排聚會或購買電影票。
即便是最優秀的網站,也僅能片面理解你的工作、個人生活、興趣和人際關係,並且在利用這些資訊為你服務方面能力有限。目前,這種工作通常只能由人類完成,例如你的密友或個人助理。
但在未來五年,這一切將徹底改變。你不再需要為不同的任務切換不同的應用程式。你只需用平常的語言告訴你的裝置你想做什麼。軟體將能夠根據你願意分享的資訊量,因為它對你的生活有了深入的瞭解,所以能夠做出個性化的響應。
在不久的將來,任何一個上網的人都能夠擁有一個由先進人工智慧驅動的個人助理。
這類軟體,能夠理解自然語言並根據對使用者的瞭解完成多種任務,被稱為「Agent」。我對 Agent 的思考已近 30 年,在 1995 年出版的《未來之路》一書中我曾提到過它們,但直到最近,因為人工智慧的進步,它們才真正變得實用。
Agent 不僅將改變人們與電腦的互動方式,還將顛覆軟體行業,引發自從我們從鍵入命令到點選圖示以來電腦領域的最大革命。
每個人的個人助理
有批評家指出,軟體公司以前也提供過類似的服務,但使用者並沒有完全接受。(人們至今仍然會拿 Clippy 這個我們曾經在微軟 Office 中加入後來又放棄的數位助理開玩笑。)那麼,為什麼人們會使用 Agent 呢?
答案是 Agent 將大幅改進,你將能夠與它們進行更為細膩的對話,它們將變得更加個性化,並不僅僅侷限於諸如寫信等相對簡單的任務。Clippy 與 Agent 之間的差異,就像旋轉電話與智慧手機之間的差異一樣大。
Agent 將能夠在你願意的情況下協助你完成所有活動。一旦獲得許可權,Agent 可以追蹤你的線上互動和實際位置,從而深入瞭解你所參與的人、地點和活動。它將掌握你的個人和工作關係、興趣愛好、偏好和日程。
你可以選擇何時何地讓它介入協助你做決定或幫助完成某項任務。
要了解 Agent 將帶來的巨大變化,我們可以將它們與今天的 AI 工具進行對比。這些工具大多是機器人,限制在單個應用程式中,通常只在你特定提出需求時才會介入。由於它們無法記住你每次的使用習慣,因此無法學習並適應你的偏好。
「Clippy 就是一個機器人,而不是 Agent。」
Agent 則更加智慧。它們能夠主動提出建議,而不僅僅是在你提出請求時才反應。它們能夠跨應用完成任務,並且隨著時間的推移不斷進步,因為它們能記住你的活動並識別你行為中的意圖和模式。基於這些資訊,它們會主動提供它們認為你需要的東西,儘管最終決定權始終掌握在你手中。
想像一下,你想規劃一次旅行。一個旅行機器人可能只能幫你找到符合預算的酒店。而 Agent 則知道你將在哪個季節出行,並且根據它對你是否總是嘗試新目的地或喜歡重複訪問同一地點的瞭解,能夠為你提出目的地建議。在被詢問時,它還會根據你的興趣和冒險傾向推薦活動,並為你預訂你喜愛的餐廳。如果你今天想要這種深度個性化的規劃,你需要支付旅行 Agent 的費用並花時間告訴他們你的需求。
AIAgent 最令人興奮的影響,在於它們將讓今天對大多數人來說過於昂貴的服務變得普及。它們將在醫療、教育、生產力以及娛樂和購物等四個領域產生巨大的影響。
醫療保健
在當今醫療保健領域,人工智慧主要是協助處理行政類任務。例如,Abridge、Nuance DAX 和 Nabla Copilot 等系統可以在醫生診斷時記錄音訊,並整理成筆記供醫生稽核。
真正的變革將在 Agent 能夠協助患者進行初步分診、提供處理健康問題的建議,以及判斷是否需要就醫時到來。這些 Agent 還將助力醫療工作者做出更明智的決策,提升其工作效率。(例如,像 Glass Health 這樣的應用能夠分析患者病情摘要,並為醫生提出可能的診斷建議。)對病人和醫療工作者的幫助,對於那些貧窮國家的人們尤為重要,因為在那裡很多人根本無法看到醫生。
這些臨床 Agent 的推廣速度會慢於其他型別,因為準確無誤是關乎生死的大事。人們需要確信,儘管這些健康 Agent 不完美且可能犯錯,但總體上是有益的。當然,人類也會犯錯,沒有醫療保健同樣是個問題。
「美國有一半需要心理健康護理的退伍軍人沒有得到相應的治療。」
心理健康護理是另一個 Agent 將普及至幾乎所有人的服務領域。如今,每週進行一次心理治療似乎是一種奢侈。但實際上,有很多未被滿足的需求,很多需要心理治療的人卻無法獲得。例如,蘭德公司的研究發現,美國有一半需要心理健康護理的退伍軍人並未得到治療。
經過專業心理健康訓練的 AIAgent 將使心理治療變得更加經濟實惠且易於獲取。Wysa 和 Youper 是這一領域的兩個早期聊天機器人示例。
但 Agent 的作用將更加深入。如果你願意與心理健康 Agent 分享充分的資訊,它將能夠理解你的生活歷史和人際關係。它會在你需要時隨時待命,永遠不會感到不耐煩。有了你的允許,它甚至可以通過智慧手錶監測你在治療過程中的生理反應 —— 比如當你談論與老闆的問題時心跳加速 —— 並建議你何時應該尋求人類心理治療師的幫助。
延伸閱讀:探討 | 在醫療領域,區塊鏈可以被應用在哪些方面?
教育
幾十年來,我一直對軟體如何簡化教師工作和幫助學生學習充滿期待。它不會取代教師,而是會補充他們的工作 —— 為學生量身訂製教學內容,並讓教師從繁瑣的文書工作和其他任務中解放出來,從而有更多時間專注於工作的最重要部分。這些改變終於以顯著的方式開始實現。
目前的先進技術是可汗學院開發的基於文字的機器人 Khanmigo。它能夠在數學、科學和人文學科中為學生提供輔導 —— 例如,解釋二次方程式並建立數學習題供練習。它還能幫助教師進行課程規劃等工作。我長期以來一直是 Sal Khan 的工作的支援者,並最近在我的 Podcast 中邀請他討論教育和 AI。
但基於文字的機器人只是第一步 ——Agent 將開啟更多的學習機會。
例如,很少有家庭能負擔得起為學生提供一對一輔導來補充課堂學習。如果 Agent 能夠模仿有效家教的特點,它們將為所有需要的人提供這種補充教學。如果一個輔導 Agent 知道一個孩子喜歡 Minecraft 和泰勒・斯威夫特,它將利用 Minecraft 來教授體積和面積的計算,並通過泰勒的歌詞教授講故事和押韻技巧。與今天的基於文字的輔導相比,這種體驗將更加豐富 —— 例如,結合圖形和聲音 —— 並且更加個性化。
延伸閱讀:23歲的「AI正妹」月入500萬美元,她成了2萬人的女友
生產力
在這個領域,競爭已經非常激烈。微軟正在將其 Copilot 功能整合到 Word、Excel、Outlook 等服務中。Google也在通過助理、Bard 及其生產力工具做著類似的事情。這些智慧助手能完成許多工,比如將文字文件轉換成幻燈片,用自然語言回答電子表格相關問題,以及在體現每個人觀點的同時總結電子郵件討論。
Agent 的能力將更為強大。擁有一個 Agent 就像有一個專門協助你處理各種任務並在你需要時獨立完成它們的人。例如,如果你有一個商業想法,Agent 可以幫你撰寫商業計劃,製作簡報,甚至生成你產品可能的外觀影象。公司可以為員工提供 Agent 服務,讓 Agent 直接參與每次會議,回答問題。
「如果你的朋友剛做了手術,你的 Agent 將主動提出送花,並能為你完成訂花服務。」
無論你是否在辦公室工作,你的 Agent 都能像現今的個人助理一樣為你提供幫助。如果你的朋友最近接受了手術,你的 Agent 會主動建議送花,並能幫你完成訂購。如果你想和大學室友重聚,它會與對方的 Agent 協作安排見面時間,並在你抵達前提醒你,他們的大孩子剛剛開始在當地大學上學。
娛樂和購物
如今,人工智慧已能幫助你挑選新電視,推薦電影、書籍、節目和Podcast。同樣,我投資的一家公司最近推出了 Pix,它允許你提出問題(例如,「我會喜歡哪些羅伯特・雷德福的電影?我在哪裡可以看?」),然後根據你過去的喜好做出推薦。Spotify 的 AI 驅動 DJ 不僅根據你的偏好播放歌曲,還會與你交流,甚至能稱呼你的名字。
Agent 不僅僅會提出推薦,它們還會幫助你實現這些推薦。如果你想買相機,你可以讓 Agent 為你閱讀所有評測,總結它們,給出建議,並在你做出決定後幫你下單。如果你告訴 Agent 你想看《星球大戰》,它會知道你是否已訂閱了相應的流媒體服務,如果沒有,它會提出幫你註冊。如果你不確定想看什麼,它會提供訂製化的建議,然後幫你播放所選的電影或節目。
你還可以獲得根據你的興趣訂製的新聞和娛樂內容。CurioAI 就是這一趨勢的一個例子,它能根據你提出的任何主題建立訂製Podcast。
技術行業的鉅變
總之,Agent 將能夠幫助處理幾乎所有活動和生活各個領域的事務。這對軟體業和整個社會都將產生深遠的影響。
在計算行業中,我們討論的是平臺 —— 應用程式和服務構建的基礎技術。Android、iOS 和 Windows 都是平臺的例子。Agent 將成為下一個平臺。
「要建立一個新的應用程式或服務,你只需要告訴你的 Agent 你的需求。」
要建立一個新的應用或服務,你不需要掌握程式設計或圖形設計技能。你只需告訴你的 Agent 你的需求。它將能夠編寫程式碼,設計應用的外觀和感覺,建立一個 logo,並將應用釋出到線上商店。OpenAI 本週推出的 GPTs 展示了一個未來預覽,即非開發人員也能輕鬆建立和分享他們自己的助手。
Agent 將影響我們使用軟體的方式以及軟體的編寫方式。它們將取代搜尋網站,因為它們在為你查詢和總結資訊方面會更加高效。它們將取代許多電子商務網站,因為它們能為你找到最佳價格,並且不受限於少數幾個供應商。它們將取代文書處理軟體、電子表格以及其他生產力應用。今天是獨立的業務 —— 搜尋廣告、帶廣告的社交網路、購物、生產力軟體 —— 將合併成為一個業務。
我認為不會有任何單一公司主導 Agent 業務 —— 將有許多不同的 AI 引擎可供選擇。如今,Agent 被嵌入到其他軟體中,如文書處理軟體和電子表格,但最終它們將獨立運作。雖然一些 Agent 將免費使用(並通過廣告支援),但我認為你將需要為大多數 Agent 付費,這意味著公司將有動力讓 Agent 代表你的利益,而不是廣告商的。今年開始研究 AI 的公司數量表明,將會有異常激烈的競爭,這將使 Agent 的價格非常親民。
但在我所描述的高階 Agent 成為現實之前,我們需要面對關於技術及其使用方式的諸多問題。我之前已經寫過 AI 引發的問題,所以在這裡我將專門聚焦於 Agent。
技術挑戰
目前還沒有人弄清楚 Agent 的資料結構應該是怎樣的。為了建立個人 Agent,我們需要一種新型資料庫,它能夠精確捕捉你的興趣和關係的細微差別,並在保護隱私的同時快速提取這些資訊。我們已經開始看到一些新的資訊儲存方式,比如向量資料庫,這可能更適合儲存由機器學習模型生成的資料。
還有一個未解之謎是,人們將與多少個 Agent 互動。你的個人 Agent 是否會與你的心理治療 Agent 和數學輔導 Agent 分開?如果是這樣,那麼在什麼情況下你希望它們相互合作,而什麼時候應該保持各自的獨立?
「如果你的 Agent 需要與你聯絡,它會通過耳機對你說話,或在你的手機上顯示資訊。」
你將如何與你的 Agent 互動?目前公司正在探索包括應用程式、眼鏡、吊墜、別針,甚至全息圖在內的各種選項。這些都是可能的方式,但我認為人類與 Agent 互動的首個重大突破將是耳機。如果你的 Agent 需要與你聯絡,它會通過耳機對你說話,或在你的手機上顯示資訊。(「你的航班延誤了。你想等待,還是需要我幫你重新預訂?」)如果你願意,它還可以監控進入你耳朵的聲音,並通過消除背景噪音、增強難以聽清的語音或使帶有重口音的人說話更容易理解來提升聽覺體驗。
還有其他的挑戰。目前還沒有一個標準的協議允許 Agent 之間相互通訊。Agent 的成本需要降低,使其對每個人都負擔得起。啟用 Agent 以獲得正確答案的過程需要更加簡單。我們需要防止在諸如健康這樣的領域中出現幻覺,因為在這些領域中準確性至關重要,同時確保 Agent 不會因為偏見而傷害人們。我們不希望 Agent 做出它們不應該做的事情。(儘管我對惡意 Agent 的擔憂少於對人類犯罪分子利用 Agent 進行惡意活動的擔憂。)
隱私和其他重大議題
隨著這些技術的融合,線上隱私和安全問題將比現在更加迫切。你會希望能夠決定 Agent 可以訪問哪些資訊,以確信你的資料只被你選擇的人和公司所共享。
但你與 Agent 分享的資料歸誰所有,如何確保它被適當使用呢?沒有人希望因為他們告訴心理治療 Agent 的事情而開始收到相關廣告。執法部門可以使用你的 Agent 作為對你不利的證據嗎?你的 Agent 什麼時候會拒絕做可能對你或他人有害的事情?誰來確定 Agent 內嵌的價值觀?
還有一個問題是 Agent 應該分享多少資訊。假設你想見一個朋友:如果你的 Agent 與他們的 Agent 交流,你不希望它說,「哦,她週二要見其他朋友,並不打算讓你參加。」如果你的 Agent 幫你寫工作郵件。
它需要知道不應使用你的個人資訊或前任工作的專有資料。
這些問題中的許多已經是科技行業和立法者的關注重點。我最近參加了由參議員查克・舒默組織的一場 AI 論壇,其他技術領導者也參加了這次論壇,許多美國參議員出席。我們分享了關於這些和其他問題的想法,並討論了立法者採取強有力立法的必要性。
但其他問題不會由公司和政府決定。例如,Agent 可能會改變我們與朋友和家人的互動方式。今天,你可以通過記住他們生活中的細節 —— 比如他們的生日 —— 來表明你關心他們。但當他們知道很可能是你的 Agent 提醒你這件事並負責送花時,這會對他們來說還有意義嗎?
在遙遠的未來,Agent 甚至可能迫使人類面對關於目的的深刻問題。想像一下,Agent 變得如此優秀,以至於每個人都可以在幾乎不用工作的情況下享有高品質的生活。在這樣的未來,人們將如何利用他們的時間?當 Agent 擁有所有答案時,還會有人想要接受教育嗎?在大多數人有大量空閒時間的情況下,能否維持一個安全繁榮的社會?
但我們離這一點還很遠。
與此同時,Agent 正悄然到來。
在未來幾年裡,它們將徹底改變我們的生活方式,無論是線上還是線下。
📍相關報導📍
全鏈遊戲的密鑰,鏈遊引擎最新進展:MUD、Dojo、Paima Engine、World Engine..