區塊鏈技術資源分享
追尋中本聰先生的腳步
?

區塊鏈激勵設計如何激勵非理性人類?復雜的加密經濟系統設計十分困難_引入行為經濟學_碳鏈價值

2009年,中本聰設計了比特幣,想要把不同計算機的激勵措施匹配起來。2018年,我們已經在建設數十億美元的區塊鏈項目,鼓勵人們使用同一套原則。我們預測會出現有效的市場,預測人群是有智慧的。然而,倘若人群不那么聰明,又該怎么辦呢?

比特幣式的加密經濟學激勵設計,是一種全新的經濟設計范例。它已經實現了不可思議的成就,成為了世界上第一個被廣泛使用的數字貨幣。

近年來,這一范例變成了“終極高招”,對互聯網世界產生了深遠的影響。它向我們承諾:通過在規劃和預測中采用激勵措施,來構建令人驚嘆的未來技術。


激勵機制

許多項目都采用了這種激勵機制:

  • 在計劃、預測方面有Gnosis、Augur;
  • 在社會媒體方面有Steemit;
  • 在聲譽、管理、自組織方面有Colony、Boardroom、Democracy.Earth;
  • 在數據協同與數據洞察方面有Ocean、Numerai等。

然而,不論是簡單的激勵機制,還是從簡單機制改造過來的復雜機制,目前都是假定人們一定會作出理性的決定,會采取產出最多的行動,也會合力創造有效市場。

但行為經濟學觀點認為,從經濟學角度說,集體智慧往往不那么聰明。

行為經濟學教導我們說,人類作的決定,其絕大部分都是基于簡單的心理捷徑與“拇指規則”(譯注:單憑經驗做事,不一定準確),在通常情況下一般是正確的;但在邊緣案例中,卻經常大錯特錯,例如開車、選舉,或在復雜金融市場中交易。

這些現象在現實生活中有著大量的記載。

本文主張,目前的加密經濟學,對行為因素和心理學的關注還遠遠不夠。我們呼吁,那些人類現實經濟行為的專家,例如公共政策專家、行為經濟學家、社會學家,要盡快參與那些加密經濟學體系的設計團隊,從而確保長期的實用性、可行性、成功。

比特幣、行為經濟學、加密經濟學

區塊鏈中,激勵設計的概念最早來自中本聰的原始比特幣白皮書。我們也不妨從事情的起源——比特幣說起。

Andreas Antonopoulos制作的圖書和視頻對此進行了很好的總結。

中本聰用激勵設計是為了達到一個前人從未實現的目標:創造一種科學上可靠的、安全的、去中心化的數字貨幣。

中本聰的設計,能夠激勵礦工確保網絡安全,并使協議的正常操作擺脫缺點。此外,還能夠協調所有利益相關者的激勵措施,這些人包括礦工、用戶,開發者,都對這個生態系統有所貢獻。設計的本質是開源的,能確保有組織的攻擊變得不劃算,方法是允許利益相關者意識到攻擊,并叛逃到其他的鏈。

中本聰為“拜占庭將軍問題”(Byzantine Generals’ Problem)找到了一個聰明的對策論解決方案,方法是只要將軍忠誠,就給將軍發工資,但如果將軍企圖叛變被發現,就扣掉工資。

從歷史的角度看,中本聰的對策論假定非常溫和,溫和得令人驚訝。

只要有51%礦力合作起來,協調以擾亂比特幣,就能成功達到目的。最關鍵的是,比特幣的安全并不依賴任何“理性經紀人”假定,這一假定認為人類都是不留情面追求最優解的人,而且極端理性。

現實中,哪怕人們十分懶惰,哪怕有些人組成了陰謀集團,比特幣系統依然能保持安全。與某些現代假設,例如Steemit、Augur相比,比特幣的假設更加現實,爭議也比較小。(此外,比特幣的安全保證,相對來說很強,而且在數學上得到了證實。)

區塊鏈激勵設計

自從2009年以來,區塊鏈激勵設計已經成熟了許多。今天的區塊鏈體系找到了多種更加聰明的方式,把激勵結構用于更加復雜的體系:

Zcash和其他加密貨幣,也具有先驅比特幣的基本激勵結構,以太坊和其他二代區塊鏈體系也是如此。

Gnosis, Augur和其他預測市場,試圖用一種價格發現機制,達到預測未來的目的:激勵用戶試圖準確預測未來,而且根據這些預測而打賭。

Steemit激勵用戶貼出有趣的花邊新聞【tidbits】,并且/或者為其他人的帖子質量進行誠實的投票。其他的聲譽系統(reputation systems)激勵用戶為聲譽較好的演員投出贊成票,從而創建了一種人類“事實上的聲譽系統”的區塊鏈版。(到目前為止,還沒有人證實自己的聲譽。)

Numerai激勵數據科學家設計出優秀的算法,用于金融市場的貿易。

Futarchy 激勵用戶為良好的決定而打賭。

Ocean激勵用戶為優秀的數據集(datasets)而打賭,并為現有的數據集提供附加價值。(想一想Numerai遇見Gnosis)

Polkadot激勵那些利益相關者在網絡中作出誠實決定,即驗證者(validators)和校對者(collators);激勵他們尋找糟糕的演員,即釣魚者(fishermen);并決定哪個人值得信任,即提名者(nominators)。

激勵設計是區塊鏈系統的殺手锏

總體來說,激勵設計已經滲透到很多激動人心的應用程序當中,而且被視為區塊鏈系統的殺手锏之一。有些最重要的區塊鏈創新者在文章中抓住了這一點,例如Trent McConaghy就在最近一篇博客文章寫道:

“區塊鏈社區明白,區塊鏈可以幫助協調整個持幣著部落的行為,因為每一名持幣人都綁定了自身利益。但與簡單的激勵措施相比,區塊鏈有著更為普遍的好處:只要獎勵他們代幣,你就可以讓人們做各種各樣的工作(這些工作可能反過來又會增加代幣的價值)。區塊鏈就是一種激勵人們的機制。

我認為,這是一種超能力。區塊獎勵功能決定了你想要讓網絡參與者們做些什么。于是問題來了:你想讓你的網絡里的人做些什么?這又引發一個關鍵問題:你激勵網絡行為的水平如何?

這是細節里的魔鬼。我們果真知道怎么設計激勵措施嗎?”

從中本聰到Steemit

自從最初比特幣模型以來,激勵設計就通過某些方式得到擴展。圖表1用定性的方式畫出了目前高度擴展的激勵設計分布圖,橫軸代表的是自主性,縱軸代表的是行動空間。

“自動性”軸描述的是人類利益相關者追隨激勵措施要花費多少手工勞動。

簡單說來,在比特幣系統當中,作決定的是計算機,而在Steemit系統當中,作決定的是人類。詳細一點說,比特幣礦工連手指都不必動一下就能追隨激勵措施,只要讓計算機誠實地挖礦就行了。而Augur、Steemit系統卻依賴人類手動作出預測,寫帖子發表,并得到獎勵。還有一種位于中間的系統,Polkadot和Proof-of-Stake,要求人類假定他們信任的那些實體不會與系統對抗。

“行動空間大小”的軸,則描述了人們為了讓獎勵最大化,必須探索多少種可能的行動。

Steemit系統當中,優質帖子數量可能有多少,可能的行動就有多少;而比特幣系統當中,有效的行動空間只有一種行動:誠實挖礦,誠實校驗。Numerai系統當中,系統請一個人類設計一種優秀算法,然后根據算法的表現好壞給這個人類相應的獎勵。

激勵設計分布圖-各個去中心化系統的定性散布圖(Qualitative scatter plot ),顯示它們的自主性(automatibility),以及行動空間(Action Space)大小

激勵設計分布圖-各個去中心化系統的定性散布圖(Qualitative scatter plot ),顯示它們的自主性(automatibility),以及行動空間(Action Space)大小

自動性”軸描述的是人類利益相關者追隨激勵措施要花費多少手工勞動。

簡單說來,在比特幣系統當中,作決定的是計算機,而在Steemit系統當中,作決定的是人類。詳細一點說,比特幣礦工連手指都不必動一下就能追隨激勵措施,只要讓計算機誠實地挖礦就行了。而Augur、Steemit系統卻依賴人類手動作出預測,寫帖子發表,并得到獎勵。還有一種位于中間的系統,Polkadot和Proof-of-Stake,要求人類假定他們信任的那些實體不會與系統對抗。

“行動空間大小”的軸,則描述了人們為了讓獎勵最大化,必須探索多少種可能的行動。

  • Steemit系統當中,優質帖子數量可能有多少,可能的行動就有多少;
  • 而比特幣系統當中,有效的行動空間只有一種行動:誠實挖礦,誠實校驗。
  • Numerai系統當中,系統請一個人類設計一種優秀算法,然后根據算法的表現好壞給這個人類相應的獎勵。

比特幣激勵設計不僅需要科學家,還需要公共政策專家

由此我們可以看到,激勵設計已經擴展到在廣闊的行動空間中激勵人類內在行為的程度(例如寫博客文章)。

  • 人們相信,激勵措施力量很大;
  • 而激勵措施又在加密經濟中分布極廣。

比特幣的優秀表現,已經給這種信念下了定論。

比特幣說明,位于圖表左下方部的區塊鏈項目值得信任;

但如今,范例已經大大擴展,乃至圖表右上方的各個系統都分享了這種可靠性。最偏右上方的Steemit等系統也被人們作為一般性的基于區塊鏈的加密經濟系統對待了,而不認為它們與比特幣有一丁點不同;

但實際上,卻一直沒有評估措施確認它們的基本加密經濟模型是否合格,能經受住時間考驗。

這就說明,創造實用激勵設計所需的各種跨學科技巧,實際上是缺乏的。

這些技巧包括:機械設計、密碼學、工程學,但也包括行為經濟學和人文學科。我們需要理解人類行為各種復雜、微妙、不合邏輯的方式。區塊鏈激勵設計不僅需要科學家,還需要公共政策專家。

難點在于,人類并不是完全理性的演員。現實中的人類經常不作那些最優化的事情。

有個經典例子,就是“最后通牒博弈”(the Ultimatum Game):

給張三一百塊錢,讓張三拿出其中的一部分給李四,李四必須作出兩個選擇:接受或拒絕。如果李四拒絕,兩人都只能離開,完全拿不到錢。如果李四接受,那李四就能拿到這部分錢,張三也拿到剩下的一部分。游戲理論告訴我們,李四最理性的策略是永遠接受,哪怕張三只給一分錢也應該接受。

但是在現實中,只要給李四的錢少于30元,李四一般就會拒絕。而且,張三一般給出的至少20-30元。因此經驗主義環境下兩名玩家采取的策略都遠遠不是最優策略(就游戲理論而言)。我們可能會預測這樣的效應在Steemit一類加密經濟系統的復雜環境中還會重復。

于是我們將面臨一個很大的問題:如果基于加密經濟系統的設計規則包括了很大一部分人類因素,那么要如何做才能防止非理性入侵這些規則呢?

特別是,將這種“行為主義”思考應用于以上圖表的兩個軸之后,我們認為:

  • 激勵系統的自動性越小,就越難設計,也越多包含人類非理性帶來的風險,例如確認偏誤(confirmation bias)、沉沒成本誤區(sunk cost fallacies)、各種趨同思維(Groupthink)。
  • 行動空間越大,就越難以最優化,難以作出正確的選擇。計算機可以經常搜索很大空間,但費用則難以承受。人類的情況就糟糕得多。人類討厭被迫選擇的情況,于是搜索空間越大,認知思考成本(Cognitive Deliberation Cost)就越高,結果就越差。

因此,在“風險較低空間”(圖標上的粉色區域)之外的系統當中,演員本身會難以判斷,哪些行動會讓自己利益最大化。而且,系統設計者面臨的挑戰還要困難得多。

隨著參與者越來越難以決定采取什么行動,設計者設計穩定而可預測的系統難度會成指數上升。

哪怕在最好的條件下(個人玩家的行動空間很簡單,容易分析、優化),想要應用機械設計來創造“在荒野中”運行良好的系統,也仍然是極為困難的任務。行動一旦難以優化(因為行動將會位于“風險較低空間”之外),機制的設計者就幾乎沒有一點機會了。

建設牢固的激勵系統?

目前為止,我們已經確認:復雜的加密經濟系統,其設計十分困難,而且人們還沒有理解清楚。因此,加密經濟系統大多數都可能一開始就千瘡百孔,而且必須通過重復的迭代實現改進。

但這不正是技術系統一直以來的基本情況嗎?自從人類學會用火,掌握文字以來,我們走過了建設國家的階段,走過了太空競賽的階段,現在又開始運用計算機、軟件、網絡。這些技術一開始全都存在嚴重問題,后來隨著時間慢慢改進了。

不幸的是,加密貨幣和區塊鏈體系的現狀,并不像歷史上其他科技那樣容易實現迭代改進。

區塊鏈系統在設計上就注定了一旦應用則難以變化。

任何變化(例如分叉)都需要大多數利益相關者的全力支持,因此任何變化都必須對抗各種實在的既得利益(例如,比特幣致命的區塊大小之爭)(Block Size Debate)。

復雜的區塊鏈系統一定存在各種弱點、容易受攻擊的地方,還有設計缺陷,而這些缺陷直到系統廣泛應用之后才能暴露出來。

到了這個時候,已經存在數十億美元的市場資本和網絡效應使得既得利益更加強大,更難以對抗。一個用戶的社區只要從某個設計缺陷得利,就會在激勵措施的引導下宣稱,這是功能,不是缺陷。這是公共政策一個盡人皆知的難題,在去中心化系統興盛以后,也會顯現出來。

火上加油的是,目前呈指數增長的機制,可能會隱藏以上說到的許多問題。系統的代幣價值若能呈指數增長,比起增長停滯的情況,其行為就能減少攻擊性,增加友好程度。這意味著區塊鏈的價值增速一旦放緩,我們將看到可能造成惡性循環的下拉效應。功能失調的治理可能會使這個循環更加惡毒。

考慮人性,保持謹慎

優秀的激勵系統,哪怕在最好的條件下也極難創造出來。在區塊鏈系統之下(編碼就是法律,刻在石碑上,應用于一大群使用假名的利益相關者),優秀的激勵系統就更難創造了。

比特幣的成功并不能讓我們滿意,也不能讓我們樂觀。我們的激勵設計范例必須極端謹慎,慢慢成長,處在各種檢測與平衡措施構成的框架中。新的經濟體制一旦設計有誤,就像前一次金融危機一般,只要系統開始衰退,就會造成雪崩一樣的效應,讓災難更長也更深入。

我們必須頭腦清醒,認為區塊鏈經濟也可能面臨它取代的舊體制面臨的同樣結局。不能因為呈指數的增長和短期的收益而變得大膽,無視掉整個模式在長期方面的不穩定。歷史上,這種情況曾經導致市場外部的干預(然而,區塊鏈又處于無國界的狀態,因此用納稅人的錢救市可能并不那么方便)。

這個“美麗新世界”的先知和預言家們,在從頭創建新經濟體制的時候,將會得到足夠的建議,小心謹慎地行事。過去無數失敗的經濟系統的廢墟當中,還有無數先例和歷史數據可供我們學習。

區塊鏈系統擁有前所未有的潛力,能夠解決世界上一些最緊要的問題:

通過將激勵措施修改一致,通過擾亂既得利益,我們就能夠朝著好的方向改造社會。這個機會一定不能錯過!

推薦閱讀:

去中心化自治組織DAO區塊鏈自治

作者:Elad Verbin、Al Esmail

編譯:Morpho Hawkes、Diana

碳鏈價值

區塊鏈激勵設計如何激勵非理性人類?復雜的加密經濟系統設計十分困難_引入行為經濟學

分享到:更多 ()
0
區塊鏈神吐槽
pi幣注冊流程教程圖解中文版

來評論吐槽 搶沙發

評論前必須登錄!

 

區塊鏈資源分享聯系我

區塊鏈資源分享聯系我首頁更多新聞
做滴滴代驾还是开滴滴那个赚钱