下文我們將介紹一個集大語言模型、ZK、同態加密和 Meme 幣於一體的 AI 專案「BasedAI」。
(前情提要:NEAR參加輝達GTC大會就成AI領頭公鏈?它在憋什麼大招?)
(背景補充:人工智慧能改變以太坊?「AI+ETH」能帶來什麼創新火花)
近期 AI 賽道持續火熱。不少專案都在試圖讓自己 AI 化,冠以 「幫助 AI 做的更好」 的新主張,以期順著 AI 的風飛的更高。
但其中大部分老專案在過往的週期中已經價值發現,而類似 Bittensor 等新專案已經不再 「新」,我們仍需要尋找尚未兌現價值,且具有敘事潛力的專案。
在加密專案 「幫助 AI 做的更好」 中,改進隱私性一直都是個具有吸引力的方向:
其一是因為保護隱私天然與去中心化中的平權概念有內在共鳴,其二要保護隱私,不可避免的要用上 zk 和同態加密等技術。理念正確的敘事加上高深的技術,一個 AI 專案的發展大概率不會差。
而如果這樣一個嚴肅的專案還能加上 Meme 幣的玩法,會不會更有趣了?下文我們將介紹一個集大語言模型、ZK、同態加密和 Meme 幣於一體的 AI 專案「BasedAI」。
3 月初始,一個名為 BasedAI 的專案在推特上悄然註冊帳號,但轉帖之外也才正兒八經的發了 2 條推文;同時其官網看上去極其簡陋 —- 除了一篇高大上的論文版白皮書之外。
而某些外網 KOL 已經先人一步開啟了分析,並感言該專案可能是下一個 Bittensor。
同時,其同名代幣 $basedAI 自 2 月底開始一路高歌猛進,漲幅超過了誇張的 40 倍。
在仔細研讀了該專案的論文白皮書後,我們發現 BasedAI 是一個集大語言模型、ZK、同態加密和 Meme 幣於一體的 AI 專案;
在認可其敘事方向的同時,我們更感嘆於其精妙的經濟設計,將計算資源的排程和其他 Meme 幣的使用,很自然地聯絡在了一起。
考慮到該專案尚處在非常早期的階段,因此本期內容我們將對其進行解讀,看其是否有成為下一個 Bittensor 的潛力。
當嚴肅的科學和 Meme 結合
BasedAI 到底在幹啥?
在回答這個問題之前,不妨先看看這個 BasedAI 是誰做的。
公開資料顯示,BasedAI 由一個名為 Based Labs 的組織和 Pepecoin 創始團隊聯合開發,試圖解決當前 AI 領域大語言模型使用時的隱私問題。
前者 Based Labs 的公開資料並不多,其官網非常神祕,僅有一串由駭客帝國風格組成的技術關鍵詞(點此訪問);而組織中的研究員 Sean Wellington, 正是 BasedAI 公開的論文白皮書作者:
同時,Google 學術資料顯示,Sean 於 UC 伯克利畢業,自 06 年起還發表了多篇與清算系統、分散式資料相關的論文,擅長 AI 和分散式網路研究,看上去是一位在技術領域頗有研究的大佬。
而另一邊,pepecoin 並不是目前大熱的那個 PEPE 幣,而是最初源於 16 年就啟動的一個 meme,當時還有自己的主網 L1,目前已經遷移到以太坊上。
你可以說這是個 OG Meme,也懂 L1 的開發。
但一邊是嚴肅的 AI 科學論文大佬,另一邊是 Meme 團隊;看似業務不相關的兩撥人,如何在 Based AI 中擦出火花?
ZK 和 FHE,兼顧 AI 計算效率和隱私
如果把 Meme 成分放在一邊,BasedAI 的推特簡介其實很直接的點出了專案的敘事價值:
「Your prompts are your prompts.」 (你的提示詞就是你的)
這實際上在強調隱私和資料主權的重要性:當你使用 GPT 等 AI 大語言模型時,你輸入的任何提示詞和資訊實際上都會被對面的伺服器接收,本質上你的資料隱私暴露給了 OpenAI 或其他模型提供方。
雖然這樣看上去無傷大雅,但終歸是有隱私問題,而你只能無條件信任 AI 模型提供方不會濫用你的對話記錄。
刨去 BasedAI 白皮書中晦澀的數學公式和技術設計,你可以簡單把 BasedAI 要做的事理解成:
將你與大語言模型對話的任何內容加密,在不暴露明文的情況下,還能讓模型完成計算,並最終返還只有你才能解密的結果。
你一定會預感到,要實現這種效果,又輪到 ZK(零知識證明)和 FHE(全同態加密)這兩個隱私技術登場了。
ZK 允許你在不暴露明文的情況下,證實一件事的真假;FHE 允許你在加密的情況下, 對加密資料進行計算。
兩者一結合,就能實現 — 你的提示詞以加密形式提交給 AI 模型,模型返回給你回答,但中間的相關方都不知道你問的問題是什麼,以及回答的結果是什麼。
這聽起來不錯,但有個關鍵問題 — 執行 FHE 技術上需要消耗大量計算資源和等待時間,效率較低。
而諸如 GPT 等 LLM 大模型面向使用者,又要求快速顯示結果,如何處理計算效率和隱私保護之間的矛盾呢?
BasedAI 在其論文中專門強調了其提出的 「Cerberus Squeezing」 技術,並以複雜的數學公式進行論證:
我們無從專業的評估這個技術的數學實現,但其要做的事可以被簡單理解成:
優化 FHE(全同態加密)中處理加密資料的效率,有選擇地將計算資源集中在最有影響力的地方,快速完成計算以顯示結果。
同時論文也用資料實證了這個優化所帶來的效率提升:
在使用了 Cerberus Squeezing 的情況下,全同態加密所需要的計算步驟可以被近乎縮短一半。
至此,我們可以快速的模擬出一個使用者在使用 BasedAI 時的全流程:
- 使用者輸入提示詞,要求分析某人對話記錄中展現的情感,但希望保護記錄隱私。
- 通過 BasedAI 平臺以加密形式提交這些資料,同時指定需要使用的 AI 模型(比如情感分析模型)。
- BasedAI 網路中的礦工接收到這個任務,使用自己的計算資源來執行指定的 AI 模型,處理這批加密資料。
- 網路節點在不解密資料的情況下完成計算任務,將加密的處理結果返回給使用者。
- 使用者收到加密結果,使用自己的金鑰解密,得到了自己需要的資料分析結果。
「大腦」、礦工和驗證者
在技術之外,BasedAI 這個網路中具體有哪些角色,來執行技術並滿足使用者需求呢?首先需要介紹的,是其自創的 「大腦」 概念。
A 「Brain」 from Based Labs
一般對 AI 加密專案來說,逃不脫的幾個要素是:
- 礦工:負責執行計算任務,消耗計算資源
- 驗證者:驗證礦工完成的工作的正確性,並確保網路中的交易和計算任務的有效性
- 區塊鏈:將執行的計算和驗證任務的結果寫在帳本上儲存,並通過鏈所自帶的原生代幣激勵不同角色的行為。
BasedAI 在這 3 要素的基礎上,還套了一層 「大腦」 的概念:「你必須有一個大腦,來裝進礦工和驗證者的計算資源,讓這些資源為不同的 AI 模型進行計算並完成任務」。
說白了,這些 “大腦” 作為特定計算任務的分散式容器,用於執行修改過的大型語言模型(LLMs)。每個 “大腦” 可以選擇它希望其關聯的礦工和驗證者。
如果你覺得這個解釋很抽象,可以將擁有一個大腦理解成擁有一個 「開展雲服務的許可證」:
你想拉一批礦工和驗證者來做大語言模型的加密計算,那你必須要持有一個經營許可證,證上寫著:
- 你營業的地址在哪(編號)
- 你的營業範圍是啥(用 AI 做情感分析,文生圖,醫療助手..)
- 你的計算資源有多少,能力有多大
- 你具體拉了哪些人進來
- 你幹這這件事能獲得多少獎勵
從 Based AI 的論文中可以看到,BasedAI 的每個 “大腦” 都能容納多達 256 個驗證者和 1792 個礦工,而系統一共只有 1024 個大腦,這又無形增加了大腦的稀缺性。
而礦工和驗證者要加入某個大腦,需要這麼做:
礦工:連入該平臺,決定要分配的 GPU 資源(更適合計算),可存入 $BASED 代幣,開始計算工作
驗證者:連入該平臺,決定要分配的 CPU 資源(更適合驗證),可存入 $BASED 代幣,開始驗證工作
存入的 $BASED 代幣越多,礦工和驗證者在大腦上執行的效率越高,他們獲得的 $BASED 獎勵就越多。
顯然,一個大腦代表了一定的權力和組織關係,這也為代幣和激勵設計打開了空間(後文詳細介紹)。
不過這個大腦的設計,是不是有點眼熟?
不同的大腦,在 Bittensor 中有點類似不同的子網 subnet,執行不同特定的任務,使用不同的 AI 模型;
而在上個週期流行的 Polkadot 中,不同的大腦又像不同的 「卡槽」,來執行一個個平行鏈,執行不同的任務。
BasedAI 官方也給出了一個 「醫療大腦」 執行任務的示意:
病患醫療記錄被加密提交到醫療大腦,生成提示詞來詢問合適的診斷意見;
BasedAI 網路中合適的大語言模型在 ZK 和 FHE 的幫助下,無需解密敏感的病患資料即可生成回答,該步驟呼叫礦工和驗證者的計算資源;
醫療保健提供者從 BasedAI 網路接收加密輸出。只有提交使用者才能解密其結果,獲得治療建議,而在此過程中資料不會被暴露或洩露。
玩出花的 「大腦」 許可權售賣,利好 Pepecoin
那麼, 怎麼獲得一個大腦,拿到 AI 模型加密計算的 「開工許可證」 許可權呢?
BasedAI 聯合 Pepecoin,將這個許可權的售賣玩出了花,並賦予了 Pepecoin 這個 MEME 代幣使用價值。
由於大腦只有 1024 個,專案方很自然的利用了 NFT 的 Mint — 每售出一個大腦,都會生成一個對應的 ERC-721 代幣,你可以將其看成一個許可證。
而要 Mint 這個大腦 NFT,需要 2 種與 Pepecoin 相關的動作才能解鎖:燃燒或質押 Pepecoin。
燃燒方面,第一個大腦需要使用者花費 1000 個 Pepecoin 才能 Mint;
每 Mint 一個大腦,下一次 Mint 的成本增加 200 Pepecoin;
通過這種方式生成的大腦可轉讓交易;
如果所有 Brains 都是通過 Burn 燃燒方法獲取,則會有 107,563,530 Pepecoin 將被永久銷燬。(CMC 資料顯示,當前流通量為 133M,若這個燃燒全部實現,幾乎減少了 80% 的代幣供應量)
而在質押方面:
要求使用者質押 100,000 Pepecoin,為期 90 天;
Brain 的 ERC-721 NFT 在質押後立即發行;
通過這種方式生成的大腦不可轉讓,但會被逐漸獎勵 $BASED 專案原生代幣
90 天后可以解除質押
無論採用哪種方式,隨著更多的大腦被建立,相應數量的 Pepecoin 要麼被燒燬,要麼被鎖定,具體取決於兩種方法的參與比例。
很顯然,與其說這是 AI 資源的分配,不如說是加密資產的分配。
由於大腦的稀缺性和其開工帶來的代幣獎勵,生成大腦時對 Pepecoin 的需求將顯著增加;質押也好,燃燒也罷, 都會減少流通中 Pepecoin 的供應量,對於代幣的二級市場價格來說當然是理論上的利好。
同時,只要 ERC-721 合約中發行並活躍的 Brain 數量少於 1024 個,BasedAI Portal 將繼續發行 Brain。
如果 1024 個 Brain 全部發放完畢,BasedAI Portal 將不允許建立新的 Brain。
一個以太坊地址可以持有多個 Brain NFT。 BasedAI 門戶將允許使用者管理從與連線的 ETH 錢包相關的所有擁有的 Brain 中獲得的獎勵。活躍的大腦擁有者預計每個大腦每年可賺取 30,000 至 80,000 美元(官方論文資料)。
在這個經濟激勵的引導下,加上 AI 和隱私的敘事,可以預見 Brain 正式上線之後的火爆程度。
總結
在加密專案裡,技術本身並不是目的,技術的作用在於引導注意力,進而引導資產分配和流動。
從 BasedAI 的大腦設計中可以明顯看到,專案把 「如何促進資產分配」 這件事玩明白了: 在資料隱私的敘事正確下,把涉及到 AI 因素計算所需的資源整合成一種許可權,製造這種許可權的稀缺性,進而引導資產流入到許可權中,推高另一個 MEME 代幣的消耗。
計算資源得到了正確配置並能獲取激勵,專案的 「大腦」 資產賺到了稀缺度和聲量,Meme 幣減少了流通供應…
從造資產層面看,BasedAI 的設計相當老道,也十分精妙。
但如果真要回答那些心照不宣、避而不談、揣著明白裝糊塗的問題:
有多少人會因此使用這個隱私保護的大語言模型?有多少 AI 巨頭公司又願意與這樣不利己的隱私保護技術合作?
答案恐怕依然難以樂觀。
不過,敘事乘風起,炒作正當時。
有時我們需要的不是質疑是否真的有路可走,而是應當順風而行。
參考資料:
X:https://twitter.com/getbasedai
Pepecoin:https://twitter.com/pepecoins