我們想藉此機會感謝Ling Ren、Kartik Nayak、 Alin Tomescu、 Pratyush Mishra、Louis Guthmann 和John Adler,感謝他們給本文提供了富有教益的反饋。本文參考自 Github 帳號 Decentralized Thoughts 的文章《Data, Consensus, Execution: Three Scalability Bottlenecks for State Machine Replication》,由專欄作者ETHFANS整理、翻譯與撰稿。
如果有人很直接地問你:怎樣才能拓展狀態機複製(區塊鏈)系統呢?
你應該反問:你係統遇到的瓶頸是什麼?數據?共識?還是執行?
- 數據 Data:數據是將所有指令傳輸給所有狀態機副本的載體。舉個例子,如果一個區塊包含1MB的指令,那麼你就需要把1MB的數據發送給所有負責驗證的副本。顯然,這種情況下,系統的通道容量(帶寬)是系統可拓展的瓶頸。
- 共識 Consensus:指令到達本地之後,狀態機們就會參與共識協議(就像這裡所討論的部分同步或者同步協議)。舉個例子,如果一個共識協議需要兩次消息往返,而參與驗證的狀態機分佈在全球各地,那麼,這裡明顯的瓶頸在——由光速和地球大小而導致的延遲。
- 執行 Execution:指令到達、共識在指令排序上達成共識後,副本需要執行指令。執行引擎是一個接受舊狀態並應用指令來計算新狀態(併計算輸出)的函數。又舉個例子,如果執行需要許多密碼學計算,那麼很明顯啦,這裡的瓶頸就是副本要重複執行的密碼學計算。
需要注意的是,這三個瓶頸不是追求一種折衷,也不是兩難的困境,也不是三難困境。它們是彼此獨立的。所有狀態機複製系統的可拓展能力都受到這三種因素的限制(而且像木桶原理一樣,受制於其中條件最差的那一個)。本文將介紹一些解決這些瓶頸的方案。
延伸閱讀:【新手科普】從概念解析到項目概覽,三分鐘搞懂什麼是 “DAO”?
延伸閱讀:以太坊成功完成「伊斯坦堡硬分叉 Istanbul」,目前已 88.2% 節點完成同步
ㄧ. 從數據上提高可拓展性 Scaling Data
更好的網絡解決方案
對比特幣等密碼學貨幣而言,擴展吞吐量的能力取決於減少延遲 —— 因為某個礦工挖出的區塊需要經過一定的延遲才能傳播給所有其他礦工。
像FIBRE、Falcon、bloXroute這些系統會通過使用專用通道(pipelining)來降低延遲,並使用前向糾錯碼(foward error correction code)來傳播區塊。提高數據可拓展性的另一個辦法是通過內容可尋址網址(content addressable network)來發現對等節點並訪問內容。
具體可參考Kademlia,它不僅啟發了以太坊的RLPx編碼規範,並在libp2p上得到了推廣。
把數據遷移到 layer 2
另一種思路是,既然瓶頸源於需要複製所有指令到所有狀態機,那我不複製不就完啦!
像 Lightning、Plasma和其他Layer-2解決方方案都是如此——把中間命令傳播給一個較小的半公開團體以減少數據複製、定期向整個系統報告總結(詳情可看我們關於支付通道的文章)。
自然而然地,這種方法的不足在於:不複製所有數據會造成數據的可用性問題(data availability problem)。
而安全性依賴於每個擁有數據的半公開團體內至少有一個誠實參與者能及時地作出反應。
延伸閱讀:【新手必讀|加密小知識】關於礦工費(Gas Fee),你不可不知的 6 件事
二. 從共識上提高可拓展性 Scaling Consensus
吞吐量(Throughput)和延遲(latency)之間的權衡
有人將每秒處理交易數(TPS)作為衡量協議可拓展性的標準。
TPS是對吞吐量的度量,人們存在一個誤解 —— 以為對它單獨優化就可以實現共識可拓展性。共識可拓展性的解決方案必須同時關注吞吐量和確認時延這兩個因素。
通過成批處理來提高共識的吞吐量(但提高延遲)很簡單:只需要一天一次,而不用每隔幾秒一次,就可以讓人們就被批處理的所有數據的哈希值達成共識。
顯然,由於一天只達成一次共識,成本會被分攤,僅就吞吐量而言,共識過程就不再是阻礙實現拓展性的瓶頸了;顯然,批處理雖然能提高共識協議的吞吐量,但也會提高交易確認的時延,並不是什麼擴展共識協議性能的萬靈丹。
PBFT journal version一文充分地討論了BFT狀態機複製的延遲和吞吐量。
對基於Nakamoto Consensus的協議而言,有很多協議都試圖增加吞吐量及時延,如:Bitcoin-NG、Fruitchains和Prism。
性能(Performance)和安全性(security)之間的權衡
有人建議在更小的狀態機副本小組內達成共識,以優化共識過程的性能。降低驗證狀態機小組的規模的確可以提高性能,但這是以降低降低安全性為代價的。所以,真正的挑戰在於不減少參與狀態機的數量同時提高共識過程的性能。
提高共識協議的複雜性有望魚和熊掌兼得,例如:減少輪數,或者說改變消息傳遞的複雜度,使呈平方級增長的消息數量可以變為線性增長。本文討論了一些部分同步中的協議改進和同步中的協議改進。
可拓展性(Scale)和適應性(adaptivity)之間的權衡
基於PBFT視圖範式的共識協議容易受到攻擊者的適應性攻擊(adaptive attack)。共識協議的安全性不僅和攻擊者的規模(由狀態機副本總數決定)相關,而且和對手的適應性能力相關。
處理適應性對手的協議通常會導致更高的成本,也會在可拓展性上遇到更大的難題。
Algorand建議用基於輪次的密碼抽樣來拓展拜占庭共識,使其免受適應性攻擊者的攻擊。這種方法的模擬結果看起來很不錯。
適應性對手可以使用拒絕服務攻擊(Denial-of-Serivice attack)來阻止系統推進。HoneyBadger提出了第一個實用的異步 BFT協議——該協議在不做任何時序假設的情況下,也能保證活性。
避免對所有命令進行全排序
如果所有指令都相互依賴,那麼除了對所有指令進行全排序外,別無他選。
但是在許多工作負載中,指令不會彼此依賴和彼此干擾。舉個例子,在某些情況下,A給B支付的指令和C給D支付的指令就不會相互干擾;在這種情況下,我們沒有必要浪費昂貴的共識資源為這兩筆指令進行內部排序,沒有理由讓它成為系統的瓶頸。
在epaxos非拜占庭模型中就採用了這種(不在所有時候都搞全排序的)辦法。像Avalanche和其他基於DAG的協議,會通過允許並發提交互不干擾的指令來增加共識的吞吐量。
分片Sharding
抽像一點來看,分片是對狀態和狀態機副本集合進行分區。
每一分片控制狀態的某個部分,且共識過程是由驗證狀態機總體的某個部分來完成的。這當然也需要一些跨分片交互機制。以太坊的“Sharding FAQ”(編者註:中譯本見文末)資源正是一個很全面的資源。
分片是平行化處理數據、共識和執行這三大瓶頸的方法。實現數據和執行平行化的關鍵在於工作負載的低狀態競用(contention)。
從共識的角度來看,分片本質上就是在性能和安全之間取捨:不是用所有狀態機副本去保障一個狀態,分片技術創建了多個分區,每個驗證者副本會各自保護它們自己的分區。
(如果狀態競用程度较低)劃分许多分區會顯著提高性能。但是,因为每一分區的驗證狀態機都變得更少,安全性自然就降低了。
想了解使用分片技術,請參閱Omniledger和Ethereum 2.0。
以太坊2.0計劃將每個分區的低安全性和全局鏈的高安全性結合起來。就像Layer-2方案一樣,低安全性的分片可以定期上傳自己的狀態到高安全性的全局鏈上,並將狀態更新確定下來。這也是在安全性和延遲之間取捨——想獲得高安全性,就得等待全局鏈的周期性敲定。
三.從執行上提高可拓展性 Scaling Execution
共識和執行的分離是狀態機複製系統的基本架構設計之一(可參見Base 20013)。
分離的好處可參見Yin et al 2003。在傳統的狀態機複製系統(SMR)中,命令不僅要複製並傳播到所有副本,還得在所有副本上執行。
在很多系統中,可拓展性的瓶頸是執行指令的成本。對SMR系統的一種主要拒絕服務攻擊工段是發出合法的命令,讓整個系統浪費時間在執行上(詳情請參閱:例1和例2)。
很多系統通過設計領域專用語言來(Domain Specific Language)避免攻擊。比特幣用比特幣腳本,小心翼翼地限制每筆交易的計算複雜性。以太坊用gas機制來限制執行的複雜性,並用效率來激勵人們對Gas的使用。
平行化執行 Parallelizing execution
讓狀態機平行化執行也是一種提高執行能力的方法。
當在區塊中的大部分命令無狀態競用(相互獨立,或者說可互換順序)的情況下,這個方法是有效的。它的主要思想是設想一種在無競用的條件下平行執行、在有競用時維護安全性的協議,用該協議模擬出連續執行的結果。詳情請參看Eve 2012、Dickerson、 Gazzillo、 Herlihy、 Koskinen 2017和Saraph和Herlihy 2019。
不在SMR 內執行,使用經濟激勵和錯誤性證明來驗證(optimistic rollups 類型)
在這類解決方案中,指令作為數據提交到SMR內,但是執行不是由驗證狀態機副本完成的。狀態機副本僅充當數據可用性層。
不用副本來執行指令,而用經濟激勵機制——玩家可以通過發布債券來成為執行者。鎖定了保證金的執行者都可以提交執行結果,而其他人可以通過提交錯誤性證明來舉報執行人提交了不正確的執行結果。
如果這份錯誤性證明是正確的,執行者將受到懲罰,而提交者將得到部分獎勵。如果挑戰者在錯誤性證明上說謊,那他的保證金就會大幅罰沒。
實現高效挑戰的協議起源於Feige Kilian 2000,而Canetti, Riva, Rothblum 2011沿著這條道路推進,最終演化成採用鏈上激勵的TrueBit Teutsch, Reitwießner 2017和Buterin’s Off-Chain Oracles。
如今,這種方法在名為optimistic rollups的方案中中得到進一步發揚(詳情可參看merged consensus、Adler, Mikerah、Quintyne-Collins、Al-Bassam、Sonnino、Buterin和LazyLedger)。
不執行、用簡潔的證明來驗證(zk rollups 類型)
在本方案中,指令同樣作為數據提交到SMR中,執行同樣不關驗證狀態機副本的事。副本只是作為指令的數據可用性層。
不同於用挑戰遊戲和錯誤性證明來驗證執行結果,利用簡潔的非交互式證明也是可以的(PCP、Groth 10、Groth 16、Ben-Sasson、Chiesa、Tromer、Virza 2013-2019和survey)。
這些密碼學技術允許驗證者生成非常短的證明,同時對這些證明的驗證在密碼學上具有高度的可靠性和完整性。執行(和證明生成)只能由同一實體完成。有了簡潔證明後,驗證狀態機副本只需要驗證簡潔證明,而不需要重新執行長交易。Zexe用這個方法來建構了基於nano-kernel的證明系統,人們因此可以在UTXO中實現隱私交易。
Buterin論述zk-roll-up的文章和Ben-Sasson的podcast強調了這種拓展交易處理量的方法。詳情請查看Buterin的Youtube 影片,進一步去了解如何將隱私(零知識)添加到簡潔的證明中(zk zk rollups)中。
(最後,讓我們來聽聽這首曾今KTV必點的經典歌曲「黃立行 – 音浪 MV」)
這種簡潔的證明有很多好處:驗證證據正確性的成本非常低。而短處在於構造指令執行的證明通常比單單去執行指令的成本要高得多。還有一個壞處在於這些協議增加了大量的複雜性。此外,某些協議還需要繁複的受信任初始設置儀式。
點擊即可查看近期optimistic and zk rollups的調查/比較(編者註:中譯本見文末)。
需要注意的是,以上介紹的方法意在克服執行可拓展性的瓶頸,而不在改變數據可拓展化的瓶頸。
?相關報導?
以太坊升級前社群風向:開發者一致同意,延後難度炸彈
【新手科普】從概念解析到項目概覽,三分鐘搞懂什麼是 “DAO”?
ETHFANS專欄|以太坊 12 月 7 日 「伊斯坦堡升級」內容解讀
《BlockTempo動區動趨》LINE官方號開通囉~立即加入獲得第一手區塊鏈、加密貨幣新聞報導!