「ZK+DePIN」原語揭示了新的挖礦藍海?Vitalik Buterin 近日積極展望了 ASIC 晶片的作用,藉助 ASIC 晶片進行 ZK 計算的硬體加速,可以將以太坊的效率的安全提升到全新的水平。
(前情提要:V神喊「以太坊轉回PoW」?全網最完整解析文在這)
(背景補充:V神讚賞迷因幣:Memecoin有趣也要「有意義」!不能淪為少數人致富工具)
近日,Vitalik Buterin 對香港區塊鏈大會的突然造訪令與會者無不振奮。而這也與一定程度反應了當下加密市場的情況。近期,以太坊走勢一直相較比特幣生態稍顯疲軟,以太坊流動性的割裂、效能的受限,再次使其受到質疑。
而在本次大會上,Vitalik 對以太坊未來的進展給出了明確的建議。在主旨演講《Reaching the Limits of Protocol Design》中,Vitalik 積極展望了 ASIC 晶片的作用,藉助 ASIC 晶片進行 ZK 計算的硬體加速,可以將以太坊的效率的安全提升到全新的水平。
要解讀 ZK 硬體加速,自然要從 ZK 開始談起。ZKP 並不是全新的概念。從上世紀八十年代起,電腦科學家們就在這個方向上不斷的進行探索。當前,熱門 ZK Rollup 專案陸續上線、更多的 ZK 應用正在湧現,對應的則是 ZK 技術和市場在不斷演進。我們發現,ZK 硬體加速正在成熟,ZK + DePIN 模式嶄露頭角,這個週期的 ZKP 似乎與此前不一樣了。
零知識證明(Zero-Knowledge Proof,ZKP)被譽為加密技術領域的 「聖盃」,不僅為長久以來的隱私保護難題引入了新的解決方案,還為存在多年的區塊鏈擴容問題提供了強大的解決方案。
眾所周知,ZK 的效率問題一直是困擾著諸多的使用者的專案方。Vitalik 在香港大會上表示,ZK-SNARKs、MPC、FHE(完全同態加密)和 BLS 聚合等基於高階密碼學的協議雖發展迅速,但同時也存在效率和安全問題。
其中,以太坊 Slot 出塊時間為 12 秒,「普通」 區塊驗證時間約為 400 毫秒,ZK-SNARK 證明時間約為 20 分鐘,而以太坊的目標是實現即時證明。
為了解決這一問題,Vitalik 給出了三種解決方案,分別是 「並行化與聚合樹」、使用 SNARK algos 與hash提升效率、使用 ASIC 進行 ZK 硬體加速。
我們並不對三種方案進行優劣判斷,在此只對 ZK 的硬體加速進行深入探討。本文試圖從 ZKP 出發,向投資者解讀,為什麼 Vitalik 看好 「硬體加速」 這一目前被鮮少提及的賽道?「ZK 加速」、「ZK」、「ZK Rollups」 這些相似的名詞,又都有何區別,如何準確辨析?
從整個生態的角度來看,硬體加速賽道為何重要?為以太坊、ZK、整個加密世界提供了何種價值?我們將以 Cysic 為例,詳細探討硬體加速的昨日、現在和未來。
Vitalik 看好的硬體加速有何作用?
對於加密世界來說,ZKP (SNARKs/STARKs) 被視為擴容技術的聖盃。zk-SNARKs 通過 Verification Computation 來驗證原始計算的正確性,即首先由證明者 (Prover) 為原始計算生成簡潔證明 (Succinct Proof),同時驗證者 (Verifier) 使用更小規模計算來驗證證明 (Proof) 的正確性。
在各路擴容方案中,ZKP 促成了鏈下計算的發展。即交易不再在一層網路執行,而是在鏈下的 rollup 完成,並將多筆交易的狀態根等部份資料打包釋出到主網完成驗證和結算。主網節點可以對 Rollup 上的交易歷史通過 ZKP 進行驗證,其安全仍然由一層保證。ZKP 通過零知識證明通過數學的方式解決驗證過程中的信任問題,且所需鏈上空間小,ZK Rollup 相對一層能達到數十倍交易處理速度和處理效率。
L2 BEAT 資料顯示,前五大 ZK Rollup 總 TVL 已達約 30 億美元。這一數位距離以太坊 TVL 的 500 億美元、整個 DeFi 市場的 910 億美元規模仍具有相當大的差距。我們相信隨著 ZK 技術的成熟,ZK Rollup 的滲透率勢必將會進一步提高。在以太坊完成坎昆升級之後,EIP-4844 的引入讓 Layer 2 的費用大幅降低。在各主流 Layer 2 適配 「Blob 交易」 之後,實測資料顯示各 ZK Rollup gas 費用明顯下降。例如,Starknet 降幅約為 85% 、zkSync Era 降幅約為 65% 。
市場上的 ZK 系專案正在快速成長,市值超過 10 億美元的基於 ZK 技術的專案中,Polyhedra, Immutable、StakNet、zkSync、Mina、dYdX 等被廣為人知。這一賽道大體可分為三層:基礎設施、ZK-Rollup、ZK 應用。
基礎設施主要包括程式設計框架和工具、ZKP 證明市場、證明生成的硬體加速、ZK 機器學習等。這些賽道的專案大多圍繞 ZKP 的生成和計算展開,他們為 ZK 應用(無論是網路或者 dApp)的部署提供了技術基礎。
而最受矚目的,則是 ZK Rollup。ZK Rollup 的爆發為可擴展套件性和 「大規模採用」 的敘事提供了充足的支撐。當然,在此之上還有採用了 ZK 技術的各種 dApp,它們大多利用 ZK 的特性為加密使用者提供了隱私等其他應用。
然而 ZK 證明生成所需要的過高的計算資源卻是一個禁錮賽道進一步前進的瓶頸。
距離用例的落地還有多遠?
既然 ZK 技術如此強大,為何現在仍未被廣泛採用?主要原因是 ZK 技術的核心演算法和實現機制極為複雜。目前,被廣泛採用的主要有兩種 ZK 證明系統 ——zk-SNARKs 和 zk-STARKs。例如,zkSync、Aztec、Axiom、Scroll、Taiko 等都採用的是基於 zk-SNARK 的證明系統,而 StarkNet、dYdX、Polygon 等則採用了基於 ZK-STARKs 的證明系統。
使用零知識證明系統通常包括:「拍平計算」,「生成證明」,「驗證證明」。這其中 「生產證明」 的步驟需要大量的算力支撐。
「拍平計算」 是將一個原始計算,通過某種約束語言 (例如 R 1 CS),表達成 ZK 電路的形式。以 zk-SNARKs 為例,目前常用的證明系統包括 Groth 16、Marlin 和 Halo/Halo 2 等。其中,Groth 16 使用了 R 1 CS 作為拍平計算用的約束語言。而對較新的證明系統,例如 Halo/Halo 2 則使用了 Plonk 體系的電路約束語言,這被廣泛的運用於一些較新的 ZK 專案中,例如 Scroll、Taiko、Aximo 等。
正如我們之前提到的,ZK 證明的生成需要大量計算。我們用 KGZ-based Halo 2 舉例來簡單的分析一下這些計算的型別。首先,當我們通過前端約束語言構造好 ZK 電路之後,我們會需要把這些電路通過某種方式轉化多項式的形式,而其中多項式的階數和電路的規模正相關。之後,會使用一些密碼學的手段,例如 KZG 將這些多項式最終轉換為證明的形式。在這個過程中,主要的耗時的計算型別包括 MSM 和 NTT 兩種。
一、MSM (Multi-Scalar Multiplication) 計算用於處理與橢圓曲線相關的計算。MSM 是橢圓曲線密碼學中的核心組成部分,主要用於生成和驗證證明。MSM 型別的計算任務約佔到計算任務的 60-70% 。
二、NTT (Number Theoretic Transform) 是一種在有限域上進行的快速傅立葉變換(FFT)NTT 用於處理與多項式相關的計算。在 ZK 證明生成的計算中,NTT 型別的計算任務大約佔到全部計算任務的 25% 左右。
而 ZK-STARKs 雖然採用了不同的演算法,但也擁有自己的效能瓶頸。在證明的生成過程中,證明者需要建立一個由多個約束組成的系統,這些約束必須同時滿足才能生成有效的證明。而這些這些約束通常都是隨機生成的,FRI 演算法(Fast Recursive Integer Gaussian Sampling)使用者生成和驗證證明中的高斯取樣,以此來確保這些約束的隨機性。因此,FRI 演算法的效率對於 ZK-STARKs 的效能至關重要。
但無論採用何種路線,龐大的計算量讓這一計算的時間變得殊為緩慢。因此,如何加速這些計算的速度、提高證明生成的生成效率,成為了限制 ZKP 在當下普及的關鍵。
為了解決這一問題,使用硬體進行計算加速,成為了一種可行的解決方案。而目前市場已經產生了多個硬體加速解決方案,而究竟選用何種硬體,並無標準答案。
三種 ZKP 市場主流的硬體加速方案
當下 ZKP 市場主流的硬體加速方案分為三種,其靈活性從高到低分別為 GPU、FPGA、ASIC。
由於 ZKP 演算法中的某些步驟(如多項式乘法和 FFT 變換)可以並行處理,使用 GPU 自然可以更高效的完成 ZKP 演算法中的計算過程,這就如同多年前的顯示卡挖礦一樣。但是問題在於,GPU 的靈活性和通用型讓效能很難超越 FPGA。
FPGA 則可以通過程式設計來實現特定的邏輯功能。這種結局方案提供了更高的效率,同時也保持了一定的靈活性,可以根據需要訂製電路。在針對特定的 ZKP 演算法進行優化之後,FPGA 的效能優於 GPU。
ASIC 則是為特定任務量身打造的專用晶片,正如 ASIC 礦機為比特幣提供了強大的算力一樣,ZKP 的 ASIC 硬體加速也可為計算過程提供最高級別的效能優化。但通常來說 ASIC 只能適配單一解決方案,無法通用現存所有的 ZKP 證明任務。更普適的 ASIC 晶片從設計到流片都會遇到更大的調整。
ASIC 算力最為強大,但掣肘在於靈活性問題。因為 ZK 演算法的多樣化,加速解決方案仍然需要對多種演算法進行加速。考慮到市場上 ZKP 證明在不斷推陳出新的情況下,FPGA 的快速重配置能力使其在多個場景上具有重複使用的優勢,能夠靈活適應不同證明系統需求。因此在現階段的市場條件下,作為硬體加速服務商,只能提供僅加速單一證明系統的 ASIC 晶片服務,並不是 「此時此刻」 最好的選擇。
但 ASIC 在未來不存在爆發的潛力嗎?答案自然是否定的。
選擇合適的證明系統是一個十分謹慎的重大抉擇。由於 ZK 電路極高的設計成本,一旦確定了證明系統,ZK 專案幾乎不會輕易的變更證明系統。專案方投入資源開發了特定證明系統的電路後,通常不會輕易更換系統。雖然 FPGA 提供了一定的靈活性,但對於已經確定並投入開發的 ZK 專案來說,ASIC 仍然可以提供較高的計算效能比,這對於大規模的、計算密集型的 ZK 應用尤為重要。因此,儘管 ASIC 的初始開發成本較高,但在流片成功之後所帶來的高收益比,仍然在會市場上佔有一席之地。因此,ASIC 解決方案在市場上具有一定的穩定性和需求。
在可預見的將來,ASIC 加速方案仍是硬體加速的最終解決方案之一。
我們以硬體加速賽道的 Cysic 專案為例。Cysic 提供了包括 FPGA,ASIC,以及 GPU 在內的全硬體加速服務,這些加速服務不僅能夠提高特定 ZK 證明的生產效率,還能夠適應不同區塊鏈平臺 / ZK 專案方的需求。
例如 Cysic 開發了基於 FPGA 的 MSM 計算加速器,名為 SolarMSM。這個解決方案顯著提高了 MSM 計算的效率,能夠在短時間內處理大規模的 MSM 任務。從資料來看,Cysic 的 SolarMSM 可以輕鬆的在 300 ms 的內完成 2 ³⁰規模的 MSM 計算,這一效能在行業中處於頂尖水平。
通過這種硬體加速,Cysic 能夠有效地減少 ZK 證明生成所需的時間,從而使得基於 ZKP 的區塊鏈應用和協議更加高效和實用。這對於推動 ZKP 技術的廣泛應用,特別是在需要快速和高效證明生成的場景中具有重要意義。
目前 Cysic 已經實現了 MSM 加速方案的 POC 設計工作。基於 FPGA 的 POC 是目前所有公開的 FPGA-MSM 硬體加速結果中效能最高,是目前公開基準測試結果的 1 – 2 個數量級以上,ASIC 的設計和流片工作也正在進行之中。未來,Cysic 將在第二階段研發 12 nm 的 ASIC 晶片。目標將實現單顆 ASIC 晶片的算力可支援 MSM 和 NTT ,和其他密碼學底層運算元,同時實現單顆晶片功耗降低到兩個數量級。
此外,Cysic 也積極擁抱了基於 GPU 的加速方案,提供更靈活的 ZK,乃至 AI 計算的加速服務。
只要 ZKP 計算的更快,加密世界就距離奪取 ZKP 「聖盃」 更近了一步。
DePIN 原語驅動市場規模增長
硬體加速的重要性毋庸置疑。而另一個投資者的主要疑惑是 ZK 硬體加速將會有多大的市場規模?
Paradigm 曾做出預測,ZK 加速的市場規模與 POW 挖礦市場規模相當。正如前文所述,隨著坎昆升級的完成,ZK Rollup 的更大規模採用將為 ZK 計算帶來大量的需求。
隱私保護是另一個主要的市場需求。如 Semaphore、MACI、Penumbra 和 Aztec Network 等正在探索利用 ZK 技術來增強使用者隱私和推動大規模採用。同時,身份驗證領域也是 ZK 技術的主要用例之一,包括時下大火的 WorldID,還有 Sismo、Clique、Axiom 等專案,都致力於將 ZK 技術應用於身份管理,以提供更安全、更隱私保護的解決方案。
ZKML(Zero-Knowledge Machine Learning,零知識機器學習)則是另一個發展迅速的領域。在 AI 爆發的當下,驗證 AI 正確地、透明地工作成為剛需。而 ZKML 可使得推理等環節可以上鏈,理論上將在不透露具體內容的情況下進行驗證。
因此,無論是 ZK Rollup 的廣泛採納、隱私等 dApp 的湧現、或 ZKML 的發展均推升了 ZKP 加速的需求。
然而,ZK 加速門檻仍然較高,對於很多中小型專案方仍然極不友好。很多 ZKP 的需求方仍然需要通過中心化的方式採購加速硬體,自行部署加速服務。而且還需要根據自身的 ZKP 生成繼續路線,選擇合適的加速方案。
一個富有彈性的驗證者網路(ZK prover network)成為了行業共識的解決方案。而在此基礎上形成的 ZK Compute-as-a-Service(ZK CaaS,ZK 計算即服務)新型產品形態將解決上述困境。
以 Cysic 為例。Cysic 將加速硬體組建一個驗證者網路,FPGA、ASIC 或其他硬體,都可在網路中為使用者提供 ZK 加速算力,個人裝置也可以接入其中。對於 ZK 專案方來說,當需要算力支援來進行 ZKP 驗證時,則可直接接入 Cysic 的 ZK 算力網路,而無需進行硬體採購。對於具體的加速方案細節也無需過多的關注。目前 Cysic 已經上線了數萬張高階顯示卡,為驗證者網路儲備了充足的 ZK 算力。
當前, Cysic 已與 Scroll、zk P2P、Inference、Kinetex 等多家專案達成合作,覆蓋 ZK Rollup、ZKML、應用層等多種型別專案,其採用的證明系統包括 Halo 2、RapidSnark、Plonky2x 等多種體系,因此,Cysic 的加速計算解決方案具有較高的靈活性和通用性。
Cysic 通過加密原生的去中心化方式來配置算力的供給和需求。ZK 算力的供給端從中心化、不可拓展的硬體,升級為支援使用者均可接入的算力網路,也給個人投資者提供了更深入參與市場的機會。需求端,ZK CaaS 可為 ZK 計算提供更強的彈性和穩定性,去中心化市場通過智慧合約更高效地排程、匹配算力供需。
因此,ZK CaaS 將硬體加速變成了 「開箱即用」 的服務,且建立了一個人人皆可進行 ZK 計算加速的場景,以 DePIN 的去中心化硬體設施的網路來改造 ZK 領域,為專有或閒置的算力提供收益,使得我們有望再次迎來 ZK + DePIN 的挖礦藍海。
📍相關報導📍
V神:以太坊 blobs 走向大規模普及,L2 需往四大方向改進