隨著人工智慧技術的進步,區分人工智慧和人類智慧和人類生成變得更加困難,零知識證明就有能力解決這個問題,它讓我們能夠確定特定內容是否是通過將特定模型應用於給定輸入而生成的,而無需透露有關模型或輸入的任何其他資訊。
(前情提要:用生命阻止AI毀滅人類!AI教父離開Google:後悔研究人工智慧 )
(背景補充:科普 | ZK零知識證明是什麼?V神認為十年後與區塊鏈一樣重要 )
零知識證明 ZK 從 2022 年開始持續火熱,其技術已經取得了很大的發展,ZK 系的專案也不斷髮力。與此同時,隨著機器學習(Machine Learning, ML)的普及,也廣泛應用於生產生活中,許多企業開始構建、訓練以及部署機器學習模型。但目前機器學習面臨的一個重大問題是如何保證可信度和對不透明資料的依賴性。這就是 ZKML 的重要意義:讓使用機器學習的人完全瞭解模型而不需要透露模型本身的資訊。
1. 什麼是 ZKML
什麼是 ZKML,我們把它分開來看。ZK(零知識證明)是一種密碼協議,證明者可以向驗證者證明給定的陳述是真實的而無需透露任何其他資訊,也就是說不需要過程就可以知道結果。
ZK 有兩大特點:第一,證明了想證明的東西而無需透露給驗證者過多的資訊;第二,生成證明很難,驗證證明很容易。
基於這兩個特點,ZK 發展出了幾大用例:Layer 2 擴容、隱私公鏈、去中心化儲存、身份驗證、以及機器學習等。本文的研究重點將集中在 ZKML(零知識機器學習)上面。
什麼是 ML(機器學習),機器學習是一門人工智慧的科學,涉及演算法的開發和應用,使電腦能夠自主學習和適應資料,通過迭代過程優化其效能,無需程式設計過程。它利用演算法和模型來識別資料得到模型引數,最終做出預測 / 決策。
目前,機器學習已成功地應用於各個領域,隨著這些模型的完善,機器學習需要執行的任務越來越多,為了保證高準確度的模型,這就需要用到 ZK 技術:使用公共模型驗證私有資料或使用公共資料驗證私有模型。
目前我們所談到的 ZKML 是建立 ML 模型推理步驟的零知識證明,而不是 ML 模型訓練。
延伸閱讀:微軟AI野心不藏了,Windows Copilot 堪稱全能助理、Bing重定義ChatGPT使用方法
2. 為什麼需要 ZKML
隨著人工智慧技術的進步,區分人工智慧和人類智慧和人類生成變得更加困難,零知識證明就有能力解決這個問題,它讓我們能夠確定特定內容是否是通過將特定模型應用於給定輸入而生成的,而無需透露有關模型或輸入的任何其他資訊。
傳統的機器學習平臺,往往需要開發者將自己的模型架構提交給主機進行效能驗證。這可能會導致幾個問題:
- 智慧財產權損失: 公開完整的模型架構可能會暴露開發人員希望保密的有價值的商業祕密或創新技術。
- 缺乏透明度: 評估過程可能不透明,參與者可能無法驗證他們的模型與其他模型的排名。
- 資料隱私問題: 經過敏感資料訓練的共享模型可能會無意中洩露有關基礎資料的資訊,從而違反隱私規範和法規。
這些挑戰催生了對能夠保護機器學習模型及其訓練資料隱私的解決方案的需求。
ZK 提出了一種有前途的方法來解決傳統 ML 平臺所面臨的挑戰。通過利用 ZK 的力量,ZKML 提供了具有以下優勢的隱私保護解決方案:
模型隱私: 開發者可以在不公開整個模型架構的情況下參與驗證,從而保護他們的智慧財產權。
透明驗證: ZK 可以在不洩露模型內部的情況下驗證模型效能,從而促進透明和無需信任的評估過程。
資料隱私: ZK 可用於使用公共模型驗證私有資料或使用公共資料驗證私有模型,確保敏感資訊不被洩露。
將 ZK 整合到 ML 過程中提供了一個安全且隱私保護的平臺,解決了傳統 ML 的侷限性。這不僅促進了機器學習在隱私行業的採用,也吸引了經驗豐富的 Web2 開發人員探索 Web3 生態系統內的可能性。
延伸閱讀:科普 | ZK零知識證明是什麼?V神認為十年後與區塊鏈一樣重要
3. ZKML 應用和機會
隨著密碼學、零知識證明技術和硬體設施的日益完善,越來越多的專案開始探索 ZKML 的使用。ZKML 的生態系統可以大致分為以下四個類別:
- 模型驗證編譯器: 將模型從現有格式(例如 Pytorch、ONNX 等)編譯成可驗證計算電路的基礎設施。
- 廣義證明系統: 為驗證任意計算軌跡而構建的證明系統。
- ZKML 特定證明系統: 專門為驗證 ML 模型的計算軌跡而構建的證明系統。
- 應用程式: 處理 ZKML 用例的專案。
根據 ZKML 這些應用的生態類別,我們可以對當前一些應用 ZKML 的專案做一個分類:
ZKML 仍然是一項新興技術,它的市場還很早,而且許多應用程式只是在駭客鬆上進行試驗,但 ZKML 仍為智慧合約開闢了一個新的設計空間:
DeFi
使用 ML 引數化的 Defi 應用程式可以更加自動化。例如,借貸協議可以使用 ML 模型來即時更新引數。目前,借貸協議主要信任由組織執行的鏈下模型來確定抵押品、LTV、清算門檻等,但更好的替代方案可能是社群訓練的開源模型,任何人都可以執行和驗證。使用可驗證的鏈下 ML 預言機,ML 模型可以對簽名資料進行鏈下處理以進行預測和分類。這些鏈下 ML 預言機可以通過驗證推理並在鏈上釋出證明,從而無信任地解決現實世界的預測市場、借貸協議等問題。
Web3 社交
篩選 Web3 社交媒體。Web3 社交應用程式的去中心化特性將導致更多的垃圾郵件和惡意內容。理想情況下,社交媒體平臺可以使用社群同意的開源 ML 模型,並在選擇過濾帖子時釋出模型推理的證明。作為社交媒體使用者,可能願意檢視個性化廣告,但希望對廣告商保密使用者的偏好和興趣。因此使用者可以選擇根據喜好在本地執行一個模型,該模型可以輸入媒體應用程式來為其提供內容。
延伸閱讀:劍指推特!Instagram傳最早6月推去中心化「文字版社交App」
GameFi
ZKML 可以應用於新型鏈上游戲,可以建立合作的人類與人工智慧遊戲和其他創新的鏈上游戲,其中人工智慧模型可以充當 NPC,NPC 採取的每項行動都會發布到鏈上,並附有任何人都可以驗證以確定正在執行的正確模型的證明。同時,ML 模型可用於動態調整代幣發行、供應、銷燬、投票門檻等,可以設計一款激勵合約模型,如果達到某個再平衡閾值並驗證推理證明,它會重新平衡遊戲內經濟。
身份驗證
用保護隱私的生物特徵認證代替私鑰。私鑰管理仍然是 Web3 中最大的困點之一。通過面部識別或其他獨特因素提取私鑰也許是 ZKML 的一種可能解決方案。
4. ZKML 的挑戰
雖然 ZKML 在不斷改進和優化,但該領域還處於早期發展階段,仍存在一些從技術到實踐的挑戰:
- 以最小的精度損失量化
- 電路的大小,特別是當一個網路由多層組成時
- 矩陣乘法的有效證明
- 對抗性攻擊
這些挑戰一是會影響到機器學習模型的準確性,二是會影響其成本和證明速度,三是模型竊取攻擊的風險。
目前對於這些問題的改進正在進行,@0xPARC 在 2021 年的 ZK-MNIST 演示展示瞭如何在可驗證電路中執行小規模 MNIST 影象分類模型;Daniel Kang 對 ImageNet 規模模型進行了同樣的操作,目前 ImageNet 規模的模型的精度已經提高到 92%,預計將很快達到與更廣泛的 ML 空間的進一步的硬體加速。
ZKML 仍處於早期開發階段,但它已經開始展現不少成果,可以期待看到更多 ZKML 的鏈上創新應用。隨著 ZKML 的不斷發展,我們可以預見未來隱私保護機器學習將成為常態。
📍相關報導📍
LD Capital報告:zkSync上線兩個月,生態發展有多興盛?