10月初,OpenAI 執行長 Sam Altman 和眾多機構大佬們共同參與 Induced AI 的種子輪融資,令人訝異的是, Induced AI 的兩位共同創辦人皆不滿 20 歲。
(前情提要:ChatGPT 新產品將亮相?OpenAI 下周一舉辦首次開發者大會! )
(背景補充:怕AI毀滅人類!OpenAI成立「算力防衛隊」,預防核爆、生化攻擊、AI自我複製等災難 )
Sam Altman 又出手了。這次他投資了一個只有 5 個人的 RPA 早期團隊 Induced AI ,兩位共同創辦人 Aryan Sharma 和 Ayush Pathak ,一個 18 歲,一個 19 歲。
不只是 Sam Altman,SignalFire、Peak XV 、SV Angel 等機構共同參與了 Induced AI 這一輪 230 萬美金的種子輪融資。此次融資,科技加速器 AI Grant 的兩位創辦人 Nat Friedman 和 Daniel Gross 也加入了 Induced AI 的團隊。這兩位在科技界的大名如雷貫耳,Nat 曾任 Github 的 CEO,Daniel 創立的搜尋引擎公司 Cue 則被蘋果收購。
這支團隊及其產品有何過人之處,為何能夠吸引眾多大佬的橄欖枝呢?
RPA 3.0:開啟瀏覽器,讓 AI 完成所有工作
Induced AI 的兩位創辦人 —— Aryan 和 Ayush —— 別看年齡小,創業經歷卻相當豐富。這兩位年輕程式員的創業履歷遍及醫療、廣告、教育、區塊鏈、web3 等領域,甚至還發起過創業社群和類似孵化器的組織。
此次創立的 Induced AI 則是一款釋放企業員工生產力的「RPA 3.0」。使用者只需用簡單的英語輸入工作流程和錄屏視訊,Induced AI 就能將其即時轉換為虛擬碼,並調取多種相關工具,來執行大量重複性任務。
RPA(Robotic Process Automation,機器人流程自動化)並非新鮮概念,普通人在日常生活中也隨處可見,例如 Excel 中的「巨集」,或者很多人用來搶演唱會門票的小工具「按鍵精靈」,都可以看做 RPA 的前身。傳統的 RPA 定義上,軟體記錄人的操作,比如點選滑鼠、鍵盤輸入、開啟資料夾、傳送郵件等,並將這些操作固定下來形成規則和套路,批量地自動執行,從而節省人的時間,提升工作效率。隨著 AI 技術進步,機器識別影象、理解語言、邏輯思考的能力不斷提升,這些技術也與 RPA 結合到一起,釋放更大的能量。
正如 RPA 概念所定義的,迄今為止,市面上的 RPA 工具需要人工制定好明確的規則,而複雜任務的規則也會耗費大量人力。Induced AI 則藉助大語言模型的能力,讓工具有了邏輯推理和判斷的能力。使用者只需要說出他的需求,比如「給我建個 Jira 的 ticket」,或者「幫我篩選一波簡歷,給候選人發面試邀請」,Induced AI 就可以對要做哪些事情進行即時判斷和拆解,並自動調取相關的工具來完成整個流程。
以篩選簡歷這個任務為例,常規的人工操作流程包括:登入你的領英帳號、搜尋簡歷、評估簡歷、下載簡歷、傳送邀請等。如果領英沒有提供官方的 API 介面,過去的 RPA 很可能就卡在登入這一步了,甚至可能被判定為惡意機器人。Induced AI 在 Chromium 上構建了一個瀏覽器環境,它有自己的記憶體、檔案系統和身份驗證憑據(電子郵件、電話號碼)來執行復雜的流程,因此可以自動完成登入、填寫驗證碼、檔案下載、儲存和重複使用資料等動作,沒有開放 API 的軟體也攔不住 Induced AI。
延伸閱讀:AI 創業潮來襲!風口僅兩年,台灣的機遇和優勢在哪?
02 一波 AI Agent 正在襲來
讓工具,特別是有智慧的工具替人類幹活,是從我們的老祖宗開始就產生的夢想。從木牛流馬到 Siri,人們始終覺得這些「助手」還欠點兒火候。直到 ChatGPT 和 AutoGPT 橫空出世,AI Agent 似乎即將成為可能。
OpenAI 的研究員 Lilian Weng 撰文定義了基於大語言模型的 AI Agent:大語言模型、記憶、任務規劃、使用工具,四個模組缺一不可。儘管 Induced AI 團隊將自己定位成「RPA 3.0」,但從其產品特性上來看,他們更像一個 AI Agent,這也是為什麼 Sam Altman 等 AI 大佬一致看好這個年輕的團隊。
當前的 AI 熱潮下,Induced AI 不是第一個、也絕不是最後一個 AI Agent 團隊。
暫且不提那些訂票、點外賣的小而美 Agent,或者 AutoGPT、HuggingGPT 等幾乎人盡皆知的專案,與 Induced AI 有同樣打造 AI 員工野心的團隊就有不少。
例如今年三月完成 3.5 億美元 B 輪融資的 Adept ,自己訓練了一個 ACT-1,這個模型專門用來在電腦上響應使用者的自然語言指令並執行操作。它可以使用現有的所有軟體工具、API 和網站。 ACT-1 同樣基於瀏覽器工作,使用者可以在和 AI 的聊天框裡輸入自己的命令,例如在 Salesforce 裡建立一條銷售線索,或者在 GoogleSheet 裡計算一些資料。
無獨有偶,科技公司 Rabbit 也研發了自己的大模型 LAM(Large Action Model),並基於它推出了一套完整的「個人作業系統 Rabbit OS」解決方案。LAM 能夠觀察人機互動的介面,形成「概念藍圖」,從而在使用者的自然語言指令不那麼明確的時候理解並實現人類的潛在意圖。基於 LAM,Rabbit 還專門設計了一套軟體平臺,使其 Agent 能夠更人性化地完成任務。今年 10 月,Rabbit 獲得 Khosla Ventures 領投、老股東跟投的 2000 萬美元融資。
延伸閱讀:IOSG Ventures:LLM如何開啟區塊鏈互動新可能,點亮區塊鏈星火
03 未來已來嗎?
當然,除了創業團隊,傳統的 RPA、低程式碼、無程式碼等公司,幾乎無一不在擁抱大語言模型和 AI Agent,畢竟在今天,只要一提這兩個概念就能讓投資人和客戶眼前一亮,忍不住多看一眼。
今年以來,AI Agent 的幾個爆款應用和幾次出圈,讓人工智慧的呼聲一次次被推向高潮。可我們仍然不禁要問,未來已來嗎?眼前的熱鬧是變革還是泡沫?
如果拿自動駕駛來做個比喻,我們更為熟悉的 Copilot 和 Midjourney 這樣的產品類似 L3 級別的自動駕駛,即機器是人類的「助手」和「副駕」,而 Agent 對應著 L4 級別的自動駕駛,人類只需設定目標、監督結果,機器自己完成決策和執行。今天,L3 級別的 AI 副駕仍然處於落地應用的早期,無論是技術能力還是商業價值,尚有大量值得探討的問題,未能全面推廣。
以此看來,L4 級別的 AI Agent 大規模應用可能就更遙遠了。那麼,當前的 AI 熱又是一波割韭菜的炒作嗎?它是否會想幾年前的區塊鏈、VR、元宇宙一樣,只是曇花一現?
可以肯定的是,生成式 AI 以及相關的概念熱度正在消退。 可以看矽兔君之前的文章:《 Jasper AI 一年內估值打 8 折,AIGC 開始降溫 》。
無論是媒體關注還是市場反應都已經暗暗證實了這一點。Gartner 今年釋出的技術成熟度曲線上,生成式 AI 和 AI 增強的軟體工程都放在了膨脹期,意味著這兩項技術在未來 2-5 年都即將進入幻滅期低谷 —— 一如曾經的自動駕駛和上述技術概念。不過,正是在熱度衰減、噪聲安靜的幻滅期,才有更多有意義的經驗和知識沉澱下來,為接下來的啟蒙期奠定基礎。
在變革性技術的發展歷程中,每一次波峰波谷都有意義。
從圖靈機到 IBM 的超級電腦深藍,從機器學習到神經網路,從 AlphaGo 到 ChatGPT,每一個里程碑之間都充滿失望、懷疑和寒冬,將視線拉長,人類走到今天已經取得了長足的進步。無論是否有泡沫,未來永遠是樂觀者和實幹者創造的。