Fabric,全稱 Hyperledger fabric,中文稱“超級賬本” ,它是以區(qū)塊鏈技術為基礎設計的去中心化底層架構,是Linux基金會于2015年發(fā)起的推進區(qū)塊鏈數字技術和交易驗證的開源項目。
在接觸區(qū)塊鏈時,我們是從以太坊開始研究學習的,后續(xù)還了解學習了比特幣、小蟻、超級賬本等區(qū)塊鏈相關項目。對于金融業(yè)務,因其對系統(tǒng)的穩(wěn)定性,健壯性,處理性能以及應用的可擴展性等方面有很高的要求,通過從各方面對比,最終選擇了超級賬本作為項目的底層框架。在我們深入研究超級賬本的過程中,發(fā)現其并不是一個完善的框架,還存在著很多問題。
上圖為0.6版本整體架構圖,被標記部分是經過我們改良的模塊,主要有以下幾點:
改良共識通道及消息處理機制
在進行性能測試時,我們發(fā)現超級賬本網絡對高并發(fā)交易的處理能力存在瓶頸。通過深入分析,發(fā)現在整個底層系統(tǒng)中存在多種不同類型的消息流,例如節(jié)點間用于廣播交易的消息和共識的消息等,而每個節(jié)點處理這些消息流的管道卻只有一個,這就好比一條高速路上只有一個檢票口一樣,檢票口的處理能力直接影響到高速的堵車概率。而在系統(tǒng)中,由于消息處理管道很容易被阻塞,導致優(yōu)先級高的消息因無法及時被處理而大量堆積,從而導致整個系統(tǒng)宕機。
通過分析,我們使用分流的方式來解決管道阻塞的問題(如上圖)。用單獨的A號管道去處理優(yōu)先級低但調用頻率高的消息(例如節(jié)點間的廣播消息),而一些優(yōu)先級高的消息(例如共識消息)則通過B號管道去處理,當A號管道出現阻塞時,通過B號管道及時處理,可以逐漸消耗并恢復A號管道的能力。通過分流方式,保證各類消息能被及時處理,進而提高了系統(tǒng)的處理能力,也提升了系統(tǒng)的穩(wěn)定性。
我們知道,最小的超級賬本網絡需要四個節(jié)點才能正常運行,所以這些節(jié)點之間的通信能力就成了影響該網絡能力的一個重要因素。在測試中,我們也發(fā)現節(jié)點之間的各類通信都是通過一個通道進行處理的,當有大并發(fā)量的交易進入網絡,節(jié)點之間大部分時間都在進行頻繁的交易廣播(將自己收到的交易信息發(fā)送給其他節(jié)點,以保障交易不被丟失),無法及時處理共識,這直接影響了該網絡處理交易的能力,所以,我們通過使用雙通道,將消息分開進行處理,使消息能夠被及時處理,進一步提升系統(tǒng)的處理能力及穩(wěn)定性。
改良內存溢出
通過前面的修改,我們的重點開始落在系統(tǒng)對交易處理的能力上,而這個現象就是在壓力測試時出現的。當我們以400筆每秒的速度向底層寫入數據時,隨著數據量的增加,某個節(jié)點就會出現宕機的現象,并且無法恢復,影響了系統(tǒng)的健壯性。通過分析日志、代碼,我們發(fā)現當系統(tǒng)重啟時,會加載大量的已被存儲的數據,這使得大量的內存被消耗,沒有資源去處理其他操作,導致系統(tǒng)宕機。
我們通過修改加載數據的邏輯,在保證對數據無影響的情況下,使系統(tǒng)快速恢復運行,提高了系統(tǒng)的健壯性。
改良視圖異常
視圖是共識中一個比較重要的概念,用于網絡中各節(jié)點的共識,其主要包含共識過程中產生的所有信息及狀態(tài)。在穩(wěn)定性測試過程中,當長時間向超級賬本系統(tǒng)寫入大量數據時,會出現網絡中節(jié)點之間共識失敗,無法記錄交易的現象,通過跟蹤分析輸出日志,我們發(fā)現是由于各節(jié)點之間所存儲的視圖信息不一致而導致的。
修改代碼邏輯之后,通過將視圖階段性標識(即每執(zhí)行一定量的交易后記一個標識)和添加證書的方式來保證各節(jié)點所記錄的視圖信息的一致性,這樣使得網絡中各節(jié)點能夠穩(wěn)定運行,即使出現視圖紊亂,也會很快達成一致,恢復正常。
改良交易處理異常
對于一個金融系統(tǒng),最不能容忍的就是丟失交易或出現“雙花”的現象,而超級賬本存在丟交易和“雙花”問題。主要是因為當大量交易涌入到系統(tǒng)中,超出了系統(tǒng)的處理能力,部分交易的丟失就成為可能。為了防止這種現象的產生,我們通過增加中間層服務,控制流向底層網絡的數據量;啟用非驗證節(jié)點,使交易均等分發(fā)至其他節(jié)點,進而保證底層網絡中的節(jié)點能夠處理所有的交易,防止交易丟失。
而對于“雙花”現象,由于超級賬本網絡中各節(jié)點處理交易的延時,會導致部分交易被重復提交。經過分析,我們通過調整過濾機制及過濾的時機,保證一筆交易只執(zhí)行一次, 進而防止“雙花”現象的出現。
改良讀寫異常
在進行壓力測試時,起初只是關注了底層系統(tǒng)對寫數據的能力,并未關注對數據讀取的能力。在后續(xù)進行并發(fā)讀寫數據操作時,發(fā)現一段時間后節(jié)點與合約之間的通信會斷開,導致進入網絡的數據無法記,而查詢操作也會失敗。深入剖析代碼,發(fā)現主要原因是由于原版設計中讀寫鎖設計不合理所導致的,通過修改讀寫部分的代碼邏輯,在不影響最終結果的情況下,將通信斷開的問題進行修復,進而保證了系統(tǒng)的穩(wěn)定性及功能的完善。并且將讀寫鎖的修改方案提交到github上,為超級賬本的發(fā)展貢獻了自己的一份力量。
就現在而言,超級賬本仍處于概念驗證階段,0.6版本不能在生產環(huán)境實施運行。而通過我們團隊不懈的努力,改進后的0.6版本已經具備了上線運行的條件。隨著技術的成熟,我們推出的fabric1.0 Alpha 版本新增了許多新特性,并且此版本是官方推出可用于生產環(huán)境部署的商業(yè)級應用,期待1.0版本為我們帶來的驚喜。
(審核編輯: 林靜)
分享