新制度理论简说:政治学法学理论的新发展
丁利
(转自《行政法论坛》)
经济学家永远不能说一个制度比另一个制度更“有效率”,这一判断超越了他的能力范围。
Buchanan,1959:137-138
导言
本文无意涉及所有西方法学政治学领域内的新动向,仅按照作者的兴趣,从一个比较合理的关于制度理论的一般框架所具有的逻辑要素来组织有关的材料。
制度可以说是各种政治法律理论的核心对象。人类社会作为一种高度复杂的组织结构,在长期的进化过程中发展出一系列制度,用以规范调整人与自然以及人与人之间的关系。政治法律学说反映了人们对此的思考。我们所称的新制度理论,特指二十世纪一批西方法学家,政治学家,经济学家和哲学家用统一的方法(主要是经济学,特别是博弈论)对制度问题的探索。
与西方政治法律思想史上的其它阶段不同,当代制度理论发展的一大特征是,各种学说之间的交流和融合。由于使用共同的语言和方法,使得围绕着制度问题的对话和讨论能够得到清晰的表述,对问题的回答和答案之间的分歧也非常显明。这与传统上不同学者或不同学派往往使用不同的概念和方法体系,理论之间不能互相翻译和沟通相比,其好处是显而易见的:第一,合乎“奥卡姆剃刀”(如无必要,勿设实体)和马赫的思维经济原则;第二,正象莱布尼茨所强调的,可以消除理论上不必要的争论或者使争论还原到不同理论前提。
而最近二三十年,社会科学,尤其是法学,政治学和经济学的这种统一性的表现就在于,它们已经把基础牢固地建立在博弈论(Game theory)上。博弈论,作为研究“在相互作用相互影响的环境中人们是如何行动”的工具,使得原来学科之间的界限变得模糊,学科的结合越来越紧密。原则上,我们所面对的世界是一个整体世界,所谓的法,道德,经济,政治等概念只不过是我们用以描述世界的符号,所谓法学,政治学,经济学等学科的划分只不过是出于方便的考虑或者归咎于我们对整体的无知而不得已的选择。并且,法学是因对象而划分的学科,它自己本身几乎没有特殊的研究方法。易言之,它的大部分研究方法都是从其它学科借鉴来的(当然,这丝毫无损于其论题的崇高)。至于选择经济学作为基础工具,主要原因是历史性的,因为博弈论这门数学分支的发展历史中数理经济学家们是起了关键作用的。今天经博弈论改造过的微观经济学已经被发展为关于人类行为选择的学问。另外,微观经济学的核心,本质上就是研究制度问题的。
当然,今天的理论都是在继承传统的基础上发展起来的,新制度理论深深植根于西方政治法律思想的传统中。古希腊古罗马甚至更早年代思想家提出的永恒性的制度问题,如正义,平等,效率等,依然是新制度理论家们思考的焦点;古典自然法学派及其社会契约论思想,边沁的功利主义,实证主义等等也都被吸收进新制度理论的框架里;在方法上,数学工具是毕达哥拉斯和柏拉图时代就强调的,霍布斯和斯宾诺莎等自然法学家也非常重视,马克思在给拉法格的信中也指出其重要性,这在新制度理论中得到了系统的运用。
所谓社会科学,无非是从不同的方面来研究人们的社会行为,即研究如下四类问题:第一,人类社会是如何存在运行的,特别的,在一种制度环境中人们是如何行为的;第二,人类社会应该追求什么样的目标;第三,为了实现这些目标,人类社会可以采取什么样的制度安排;第四,随着知识和技术的进步,制度是如何发展演进的。
博弈论(Game theory)、社会选择(Social choice)理论、机制设计(Mechanism design)理论和制度变迁(institutional transformation)理论正是现代社会科学家们研究这几类问题的的标准工具。它们之间存在着密切的内在联系。博弈论是研究人们的行为是如何相互影响的,人们是如何在相互作用(interaction)之中作出自己的行为选择和行为决策的。社会选择理论所探讨的是,对于每一种社会经济环境,我们能否以及如何确定一个满足某些价值规范的社会目标集合。如果回答是肯定的,并且接受人们是按照博弈论所刻画的方式行为的,那么,机制设计理论则探究能否以及如何提供一个博弈框架(game form),使得在这个框架下的博弈均衡解是在社会选择目标集合里,也就是说,社会选择函数是可执行的(implementable),或者退而求其次,这种均衡解是无限接近于社会选择目标集合的,也就是说可以近似地执行的。而制度变迁理论试图说明,一个社会中的人们是如何从人与自然,人与人的博弈中学习和进化的,是如何运用其知识进行制度建构以规范其生活的,这个过程所体现的特征是什么,以及(特殊地)那些进行制度变革和创新的社会,对一个更基本的制度设计问题所应采取的态度和对策,等等。
在这四类问题上都有严格而系统的研究,荟萃了众多理论成果。如冯诺意曼开创,纳什(John Nash),豪尔绍尼(John Harsanyi),泽尔滕(Reinhard Selton)作出经典贡献的博弈论;阿罗(Kenneth Arrow)关于社会选择理论的著名的不可能性定理,森(Amartya Sen)的帕累托自由不可能性定理,以及豪尔绍尼的功利主义的社会福利函数和罗尔斯的正义论;赫尔维茨(Leonid Hurwicz)和马斯金(Eric S. Maskin)的机制设计理论,格罗夫斯(Theodore Groves)等人关于公共物品提供的研究;布坎南(Buchanan,James)研究政治学的公共选择理论及其宪法经济学;宾莫尔(Ken Binmore)用博弈论对社会契约论的新研究;科斯(Ronald Coase)的交易成本理论;哈耶克(F. A. Hayek)关于制度演进的理论;诺斯(Douglas North)关于政治法律制度与经济发展之间关系的制度变迁研究;等等。
但是,需要说明的是,新制度理论的大厦是集体的贡献,许多开创者的价值是在后来者的劳动成果的辉映下才显示出来的。
博弈论:关于人类行为的实证理论
现在在社会科学尤其是数理经济学中,关于人类行为的一般观点,占主导地位的是“理性人”假设以及由此派生出来的博弈论。按照阿罗的说法,“理性(rationality)是关于选择的。在任何给定的场景下,总有一个备选对象的机会集合,选择必须从中作出。理性的主要意思就是,从不同的备选对象集合作出的选择之间应该满足的一致性(consistency)条件”。而每一次选择都可以理解为,决策者对自己的各种可能的选择所导致的各种结果都有一个偏好排序(preference ordering),这种偏好排序体现了决策者的效用(utility),在数学上可以表达为决策者最大化他的效用函数。原则上讲,结果的任何要素都可以进入决策者的效用函数。“我们的经济学主体可以是纯粹的利己主义者,纯粹的利他主义者,纯粹的苦行僧,纯粹的伊璧鸠鲁主义者,或者是更有可能的,混合着这些动机的人”(Robbins,1935,pp95)。根据数学上的单调性我们可以区分利己主义(egoism),利他主义(altruism)和妒嫉(envy)型的效用函数。迄今为止,绝大多数经济学理论都以利己主义为基础。“经济学的第一原理就是每个人都只受自我利益驱动”(Edgeworth,1881,p16)。利己主义在霍布斯的名著《利维坦》中关于自然状态的描述中有着非常鲜明的刻画。包括霍氏在内的所有自然法学家强调的核心,“自然律是理性所发现的诫条或一般法则。这种诫条或一般法则禁止人们去做损毁自己的生命或剥夺保全自己的手段的事情,并禁止人们不去做自己认为最有利于生命保全的事情”。无独有偶,诺贝尔经济学奖得主布坎南的主要贡献也是在于把理性人假设引入政治学领域,开创了公共选择理论。更进一步,由于人们经常面对的是具有风险和不确定性的局面,著名数学家冯诺意曼和经济学家摩根斯顿在《博弈论和经济行为》一书中建立了冯诺意曼-摩根斯顿型预期效用函数,它成为最正统的效用函数。
博弈论(Game theory)可以说是最近几十年社会科学研究方法的最重要进展。1994年诺贝尔经济学奖授予普林斯顿大学数学家约翰,纳什(John Nash),匈牙利裔美籍经济学家斯坦福大学的豪尔绍尼(Harsanyi,J.),德国经济学家泽尔滕(Selten, R.),他们三人对博弈论的发展作出了决定性的贡献。作为着力于研究“理性人的互动行为”(Aumann,1985,p35)的一门学科,博弈论几乎可以被运用于经济学和其它社会科学的各个领域。奥曼在权威的《帕尔格雷夫大辞典》中的《博弈论》条中对这门学科的历史,它在八十年代中叶以前的发展成果作了精到的介绍。继博弈论的开创者冯诺依曼和经济学家摩根斯顿的巨著《竞赛论和经济行为》之后,九十年代的几本教科书性质的专著(Fudenberg & Tirole, 1991; Myerson, 1991; Osborne &
Rubinstein,1994),加上奥曼和哈特主编的百科全书式的《博弈论及其应用手册》(Aumann & Hart, 1992, 1994),对博弈论作了全面系统甚至可以说是包罗万象的处理。
博弈论首先是一门数学,众多数学家开创了这门学科。二十世纪初的策梅罗(Zermelo),波雷尔(Borel)等人提出了一些零散的成果,甚至现代数理经济学的鼻祖,十九世纪法国人古诺(Cournot)关于寡头垄断的分析里也已经有了后来纳什提出的成为整个博弈论的核心概念的纳什均衡的雏形。博弈论是循着从零和博弈到非零和博弈、从完全信息博弈到非完全信息博弈、从静态博弈到动态博弈的路子发展的。博弈论早期的重大贡献是著名数学家约翰冯诺意曼关于二人零和(zero-sum)博弈的最大最小定理。1950年纳什完成其博士论文,并于次年据之修改发表了已经成为经典的《非合作博弈》(Nash, 1951),开创了非合作博弈的新局面,纳什证明了任何策略型博弈都存在纳什均衡,纳什均衡成为最基本最重要的博弈解概念。后来大家发现纳什均衡要求完全信息,而现实中更多的不完全信息博弈依然无法处理。豪尔绍尼(Harsanyi, 1967-8)提供了一个方案(Harsanyi doctrine),把不完全信息博弈转化为贝叶斯博弈,并定义了贝叶斯博弈的纳什均衡解,即贝叶斯-纳什均衡。当代博弈解的研究几乎都是围绕纳什均衡的加强与减弱进行的。
博弈论研究“理性人的互动行为”(Aumann,1985,p35),这意味着两个前提:其一,博弈的结果是由所有人的行动共同决定的;其二,既然每个人都是理性的,会运用他所掌握的所有知识和信息选择效用最大化的行为,那么他选择行动时必须考虑别人同样是理性的。博弈论的近期发展表明,它本质上依赖于两个东西,即在它的模型内,博弈者的知识和技术。博弈者的技术决定了博弈的物理框架,即每个博弈者的策略集合,建立在策略组合上的支付函数等(在数学上,存在着无穷多种可能的博弈结构,而在社会科学意义上,选择什么样的博弈结构来解释现实中的现象,正是博弈论学者需要着力的);而博弈是如何进行的,即什么样的博弈解是合理的,则由博弈者的知识决定。所谓纳什均衡,就是这样一个策略组合,在其他人不改变策略的情况下,每一个人都不可能通过改变策略提高自己的所得(至于更弱和更强的博弈解,限于篇幅和本文的简介目的,此处不做深入探讨,有兴趣的读者可以参考有关文献。)。下面我们以著名的“囚徒困境”(Prisoners' dilemma)来说明什么是纳什均衡。作为博弈论中的一个著名例子,它受到的广泛注意是无出其右的。并且我们从中可以看出个人理性和社会理性是如何发生冲突的。霍布斯认为,所谓自然状态,就是“一切人反对一切人的战争状态”,这在囚徒困境中可以得到部分说明。
囚徒困境假设:甲乙二人因偷窃被抓,检察官向他们指出如图所示的各种情况下的徒刑年数(右边为相应的纯效用结果)。我们可以看到,在这里,每个囚徒都有两种战略:坦白和抵赖。纳什均衡就是两个人都选择坦白(这甚至是占优策略均衡,即每个人的策略对别人的任何策略总是最佳应对)。换句话说,不论对方如何选择,个人最优选择是坦白。因为假设乙抵赖,如果甲不坦白,二人各判2年,如果甲坦白,甲被释放,乙判10年,所以坦白比不坦白要好;反之,假设乙坦白的情况下,如果甲抵赖,甲判10年,乙被释放,如果甲亦坦白,则二人各判5年,所以坦白还是比不坦白要好。所以不论于甲于乙,坦白总比抵赖要好,最终结果是两人都选择坦白,各判5年。其实。如果两个人都抵赖,各判2年,当然比都坦白各判5年要好,但这个帕累托改进办不到。至于如何在不同的博弈结构里“走出”囚徒困境,大抵要依赖于多次博弈和某种非完全理性,比如“一报还一报”(所谓“己所不欲,勿施于人”)策略,此处也不多讲了。 囚徒乙
囚徒甲 坦白 抵赖 背叛 合作
坦白 5,5 0,10 背叛 -5,-5 0,-10
抵赖 10,0 2,2 合作 -10,0 -2,-2
关于纳什均衡作为博弈解用以描述人类行为的合理性,至少在纳什那里有两个解释。其一,“在所讨论的博弈中,对理性地进行博弈的可预期的行为的一个合理预测是什么?通过运用一些原则,如一个合理的预测应该是唯一的,参与人应能充分推理和利用知识,并且对于每一个参与人,关于其他参与人行动的知识将不会导致他的行动偏离这个合理的预期。这样我们就得到上面我们定义的解的概念。
在这种解释下,我们需要假定参与人交接整个博弈的结构,从而能各自推导出这个预期。这是一个理性和理想化要求很强的解释”。博弈论里普遍知识方面的研究就是涉及它的。其二,“大众行为”的解释。“在经济或国际政治的一些场合,利益集团不自觉地被卷入到一个非合作的博弈之中,这种不自觉使得这个场合变成了一个非合作博弈。
在这种解释下,
假定参与人对整个博弈的结构有完全的知识或者有能力进行复杂的推理不是必需的。但是我们假定参与人能对他们的各种纯策略的相对益处积累经验性的信息。我们假定存在一定的参与人群并且这些参与人的“中间分子”运用纯策略有一个稳定的平均频率”(Nash,1951,Appendix,23,21)。现在很活跃的进化博弈理论可以认为是这个方向上的深化。
社会选择理论
社会选择理论研究一个社会的价值规范问题,其核心在于个人和社会之间的关系,正如1998年诺贝尔经济学奖得主森所说“它处理如何把个人利益,判断和福利的集合转化为社会福利,社会判断和社会选择的加总形式”(Sen, 1987, 382)。
所谓社会选择,在数学上表达为一个建立在所有个人的偏好上的函数(或对应),该函数的性质代表了一定的价值规范,比如公民主权、全体性、匿名性、目标中性,帕累托最优性,无独裁性等。社会选择最重要的问题是,这些价值规范之间是否是逻辑上协调的。在这个意义上,社会选择领域笼罩在两个不可能性定理的巨大身影之下,即阿罗的不可能性定理和森的帕累托自由不可能性定理。
众所周知,多数原则是现代社会广泛接受的决策方法。洛克认为“根据自然和理性的法则,大多数具有全体的权力,因而大多数的行为被认为是全体的行为,也当然有决定权了”。但很多在自然法学家那里是想当然正确的东西在社会选择理论中是需要证明的。
正面成果是梅(Robert May)在1952年证明的,即一个社会福利函数是多数投票型的,当且仅当它满足匿名性,目标中性和正反映性。匿名性保证不会出现某一个人的意愿受到特别重视,也就是一人一票没有特权;目标中性指在合法的和技术可行的范围内,所有社会目标都受到同样待遇;正反应性表明,如果原来社会喜欢甲胜过乙,现在有至少一个原来喜欢乙的人转而喜欢甲,那么社会还应喜欢甲。这三条都是直觉上很合理的标准,而多数投票是唯一满足它们的。
但是,早在十八世纪法国思想家孔多赛就提出了著名的“投票悖论”:假设甲乙丙三人,面对ABC三个备选方案,有如图的偏好排序。由于甲乙都认为B好于C,根据少数服从多数原则,社会也应认为B好于C;同样乙丙都认为C好于A,社会也应认为C好于A。所以社会认为B好于A。但是,甲丙都认为A好于B,所以出现矛盾。投票悖论反映了直观上良好的民主机制潜在的不协调。1972年诺贝尔经济学奖的获得者肯尼思.阿罗,在他的《社会选择与个人价值》(1951)中,证明了著名的阿罗不可能性定理,把这个投票悖论形式化了。在该书中,他运用数学工具把孔多塞的观念严格化和一般化了。阿罗证明,不存在同时满足如下四个基本公理的社会选择函数:1)个人偏好的无限制性,即对一个社会可能存在的所有状态,任何逻辑上可能的个人偏好都不应当先验地被排除;2)弱帕累托原则,3)非相关目标独立性,即关于一对社会目标的社会偏好序不受其它目标偏好序变化的影响;4),社会偏好的非独裁性。
甲乙丙
a b c
b c a
c a b
帕累托最优是经济学家和其他社会科学家用来衡量社会效率最常用、最普遍、甚至是唯一的指标,它指的是这样一种状态,即大家都好得不能再好,没有一个人可以在不损害他人福利的前提下使自己的福利得以改善,而个人自由原则又是人类不懈的追求,二者都是人们直觉上能够完全接受的标准。但是,森的研究表明,这两个如此诱人的标准却是矛盾的和无法同时成立的。与阿罗定理不同的是,森的定理非常简单,它建立在三个基本前提假定之上:1),个人偏好的无限制性;2)帕累托原则;3),最小自由原则,即社会应当赋予至少两个人各自在至少一对社会状态之间有选择权,如果他认为甲比乙好,社会不应干涉而应认同。用森的话说就是,如果你想趴着睡而不想躺着睡,社会应当认可。但是,森证明,对于二人以上的社会,不存在同时满足上述三个条件的社会选择函数(Sen, 1970)。因为,帕累托最优与最小自由原则结合在一起,会出现与阿罗不可能性定理所揭示的孔多塞投票悖论类似的循环性结果。
定理的意义可以用经丹尼斯 缪勒(Danis Muller)修正过的例子(森是它的原始作者)揭示出来。假设一个二人社会由好色的张三与拘谨的李四组成,他们面对着那本有名的《查特莱夫人的情人》。好色的张三希望由李四来读这本书,但相比谁也不读它而言,他宁肯自己来读它;而拘谨的李四则希望最好大家都不读这本书,但相对张三读来说,还不如他自己来读。如此则有下面的矩阵: 张三
李四 不读 读
读 a b
不读 c d
如果我们赋予李四选择横行的策略的权利,张三选择纵列的权利。那么,对李四来说,(c,d)好于(a,b);对张三来说,(b,d)好于(a,c)。显然李四选择不读,张三选择读,这个结果d帕累托劣于a。正如缪勒所指出的,上述矩阵类似于博弈论中著名的囚徒困境。
我们面临的是与古希腊神话里那个推石上山的希绪索斯同样的困境。正如俗话说的好,你不能既要马儿跑,又要马儿不吃草。森和阿罗的定理表明,我们并不是总能达到十全十美的境界(我们没法鱼与熊掌兼得)。这只是问题的一面,另一面是我们现实里能达到什么样的境界,我们是怎么饶开这些“不可能困境”而避免落入悖论的呢?或者说,如果这些尴尬是避免不了的,那么我们在现实中是如何区分民主与非民主,自由与非自由社会的呢?
这两个定理都是建立在序数偏好上的,一个直觉上很诱人的思路是,如果利用基数偏好提供的更多的信息是否能够走出这些困境,这意味着放弃阿罗的不相关选择目标的独立性条件。森后期的研究很大一部分集中在这个方面,即如何测度效用,以建立能让人们接受的社会选择规则。鉴于森的重大贡献,他获得了1998年诺贝尔经济学奖。
基数偏好意味着人际间的效用比较。豪尔绍尼和罗尔斯(有些文献认为罗尔斯的理论不必需要技术偏好)据此得到了他们的著名结果。社会选择理论研究的很大一部分是围绕着这两个结果展开的。
豪尔绍尼(Harsanyi, 1955)的可加总的社会福利函数,可以看作是边沁的功利主义主张“最大多数人的最大幸福”的形式化。卢梭曾写道:“公意只考虑到公共的利益,而众意则考虑到个人的利益;众意是个别意志的总合。但是,在众意里去掉其正负相抵消的部分,则减余的部分是公意”。后来以边沁为代表的功利主义者也主张最大多数人的功利的最大化。豪尔绍尼(John Harsanyi,1955)建立了一个可加总的社会福利函数,才真正使我们看清楚了什么前提下我们可以接受这种功利主义的观念,最主要的是我们假设每个人都是预期效用最大化行为者,并且假设“一个人有相同的可能性被置于社会的任何具体成员的位置上”(Harsanyi, 1953,435)。他的定理指出,社会福利函数可以表达为,赋予每个人的效用一定权重,根据这些权重进行加总(如果在考虑到平等原则,就是个人效用的简单加总)。定理的前提中包含了社会福利函数和个人效用函数一样都是基数的,并且满足冯诺依曼-摩根斯顿公理或等价的前提。
与豪尔绍尼不同的是,罗尔斯正义论不是建立在严格数学论证的基础上,甚至包含某些不协调。但无论如何,这是一项重要的贡献。原来人们对公平的理解通常是平均分配(所有社会资源和产品在每个人之间的平均分配)和无妒嫉型分配(即没有人会妒嫉他人的处境),罗尔斯提出了另一个很有吸引力的标准。他认为正义应该满足如下两个原则:其一,每个人都有关于平等的基本自由的最广泛配置(与所有人的类似自由配置相容)的平等权利;其二,社会和经济的不平等要符合两个条件,a)他们应使社会中处境最糟糕的成员相对的预期效用最大(最大最小公平原则)b)并且附以在机会的公正平等条件下职位和地位向所有人开放(Rawls, 1972,p55)。这些原则之间满足词典式排序。在这些原则中,真正引起争议的是最大最小原则。罗尔斯曾罗列了接受这个原则的几点理由:很可信的正常的风险回避(给定初始地位的特殊细节);要求的信息不多;作为一个公共原则较为适宜;承担义务的张力较弱(Rawls, 1974)。与豪尔绍尼类似,假设所有人处在一个“无知之幕”后面的前提起着重要作用。执行这个原则会导向一种极端的“分配正义”,普拉特证明存在一个不可能性结果:罗尔斯型的正义论会使一个人具有独裁性,由他来决定谁是处境最糟糕的人(Plott, 1976)。哈耶克也指出:“分配正义原则,除非整个社会都被组织得与其一致,否则就不能执行。这将产生一个在所有重要方面都是自由社会反面的社会,在这种社会里,权威决定了个人要做什么和如何去做”(Hayek, 1960, p100)。
由于森后期的研究与豪尔绍尼和罗尔斯遵循的是同一个思路,我们有必要适当讨论一下个人自由原则。在森看来,个人自由意味着,对于社会中的每一个人都至少在某一选择上有被社会认同的自由,其本意在于给每个人以一定的个人空间,使得他在这个空间内作出的选择能够得到社会的认可。但是,森对自由的定义和刻画存在着一些问题,如果用博弈论的实证语言来描述社会、制度和权利的话,那么,一个社会的存在状态就是个人决策与环境共同作用的结果。这样,自由实际上已经被赋予在博弈框架内,个人的策略范围就是他的自由的界限。或者说,在技术赋予的可能范围内,制度通过对博弈结果的影响限制了博弈者的合理策略集合。基本自由体现在个人对备选策略的选择权上,所以我们总是存在着最小的自由。至于个人自由选择是否总是能够导致帕累托最优,从囚徒困境给我们的启发看,在一般意义上大部分博弈的结果是非帕累托最优的(杜比有一个定理证明了这点)。结合豪尔绍尼和罗尔斯的贡献(仅仅在社会选择意义上,他们的研究都是无可非议的),我们可以提出这样一个问题:能否有一个全知全能而又不怀私心的裁判或中央计划者,或者一个所谓民主的集中的决策程序,通过它确立一个社会目标,这个目标满足帕累托最优以及更广泛的其他社会选择规则,并且进一步找到一种构造式的可操作可控制的直接实现目标的方法。特殊地说,是否有这样一种可能,既然自由和帕累托最优如鱼和熊掌不可兼得,那么,通过一个限制或代替个人自由的集中决策程序,就可以直接实现帕累托最优(这实际上是一个机制设计问题,后面要讨论)。
最后,我们引用森对社会选择理论的总结性评述:“社会选择理论在过去几十年受到极大关注的理由之一是和它处理的领域的重要性联系在一起的(在广泛意义上这个领域刻画了理论的特征)。另一个原因在于,它在把含蓄的思想明确化,保持这些思想含义的一致性和明晰性方面硕果累累。作为一种方法论学科,社会选择理论在澄清早先是模糊的问题上卓有成效。尽管不顾一切地坚持明晰性也有一些限制(有时用于社会选择理论的公理结构的狭窄性确实被视为一种局限),但在分析涉及集体加总的经济,社会和政治问题时,社会选择理论与其它方法论传统相比无疑很有创造性。要对本文所述及的众多文献作出判断,看看它们在澄清含混解释模糊方面的成就即可。也许所谓成功是令人喜忧参半的,但这乃是意料之中的”(Sen, 1987, 389)。
机制设计理论与制度安排
社会选择理论是一种抽象的规范理论,从元理论的角度来看,研究者可以假设他作为一个客观的观察者,了解所有人的偏好,从而能够确定那些帕累托最优点以及其它一些合理的社会选择目标。但是,在机制设计理论中,机制设计者没有也不可能了解所有信息,问题在于,在信息不完全(不具备可观察性(observable),可测度性(measurable)或可确认性(verifiable))的情况下,如何设计出有效的制度。哈耶克认为:“社会理论的整个任务,乃在于这样一种努力,解释整个经济活动的秩序是如何实现的:这个过程运用了大量的知识,但这些知识并不是集中在任何单个人脑中的知识,而仅仅是作为不计其数的不同的个人的分立的知识而存在的。”(Hayek,1967)。假如能够了解和掌握全部信息,那么,机制设计就只是一个简单的优化计算问题,象计划经济那样的直接控制和强制命令就是最好的制度。这样也就不存在什么机制设计问题。
机制设计理论的思想渊源可以追溯到30年代关于社会主义的大论战。米塞斯指出,“自由主义和社会主义,两者都献身于全人类的善,它们之间的区别不在于它们的目标,而在于它们用以达到最终目标的手段[Mises, 1985]”。论战的另一方主将之一兰格的学生,美国数理经济学家利奥.赫维兹(他引入了至关重要的激励相容(incentive compatibility)概念)在六七十年代创立了机制设计理论,尝试对这些问题作出回答。
机制设计需要解决两个问题:一是信息成本问题,即所设计的机制需要较少的关于消费者、生产者以及其他经济活动参与者的信息和信息(运行)成本。任何一个经济机制的设计和执行都需要信息传递,而信息传递是需要花费成本的,因此,对于制度设计者来说,自然是信息空间的维数越小越好。乔丹(Jordan,1982)证明,对于新古典经济环境类,不存在其他经济机制(包括市场社会主义)既能导致资源有效配置,又比竞争市场机制使用了更少的信息,后者是唯一的信息空间最小且有效的经济机制。这就部分证明了哈耶克在30年代大论战中作出的判断。
二是机制的激励问题或积极性问题,即在所设计的机制下,使得各个参与者在追求个人利益的同时能够达到设计者所设定的目标。在不同的博弈行为假设下,机制设计理论会有不同的结果。首先受到关注的是占优策略(dominant strategy)。所谓占优策略,就是一种以不变应万变的策略,不管别人采取什么策略,我的策略总是致胜之道。问题在于,讲真话不满足激励相容约束,在别人都讲真话的时候,必然会有一个人,他可以通过说谎而得到好处。如萨缪尔森在讨论公共物品的提供问题时指出:“对每个人来说这是符合自我利益的,发出错误的信号,在一个给定的集体消费行为中假装只有比真实所得更小的好处”(Samulson,1954,pp 388-9)。
那么,什么时候或者说在什么样的机制下人们愿意讲真话呢?只有当社会选择的规则只照顾一个人的利益的时候,这个人才有动力讲真话,这时,其他人讲假话没有什么好处,讲真话也没有什么坏处,讲讲真话也无所谓,所以能被占优策略均衡所执行的社会选择规则只能是独裁性的。这就是吉巴德-萨特斯维特的操纵定理。通过虚假显示自己的偏好可以操纵最后结果以使自己得利。我们再通过投票问题说明这个定理(如图是甲乙丙三人的真实偏好)。
甲乙丙
a b c
b c b
c a a
对于丙来说,如果他真实地显示偏好,那么显而易见只能是他比较不喜欢的b当选,因为两两比较,则b好于a并且b好于c。如果他显示自己的偏好是c好于a好于b,那么两两比较,则c好于a,a又好于b,最终是他喜欢的c当选。
赫维兹的“真实显示偏好”不可能性定理(Hurwitz, 1972)是一个类似结论。在个人经济环境中,在参与性约束条件下(即导致的配置应是个人理性的),不存在一个有效的分散化的经济机制(包括市场竞争机制),能够导致帕累托最优配置,并使人们有动力去显示自己的真实信息,也就是说,真实显示偏好和资源的帕累托最优配置是不可能同时达到的。因为,如果一个人愿意讲真话,那就意味着讲真话是他的占优策略。因此,在机制设计中,要想得到能够产生帕累托最优配置的机制,很多时候必须必须放弃占优均衡假设,即放弃每个人都讲真话办真事的假定。
至于在纳什均衡行为假设下以及其它博弈解概念下的机制设计问题,在这篇综述里就不涉及了,有兴趣的读者可以参考许多原始文献,笔者的博士论文里面也会有详细的介绍。我们想强调的是,任何制度安排和机制设计,都不得不考虑激励问题。我们要实现某一个目标,首先要使这个目标是在技术可行性(feasible)范围内;其次,我们要使它满足个人理性,即参与性,如果一个人不参与你提供的博弈,因为他有更好的选择,那么你的机制设计就是虚设的;第三,它要满足激励相容约束,要使个人自利行为自愿实现制度的目标。孟德斯鸠在《论法的精神》里有一个绝妙的例子。中国通常对抢劫罪的处罚是徒刑,而俄国的处罚则是死刑,结果导致的是,在俄国因抢劫而杀人的案子非常多,因为只有死人才不会指控一个人犯抢劫罪。所以不适当的立法往往与立法的美好愿望南辕北辙。
我们有必要在此提一下著名的科斯定理。虽然科斯指出“在零交易费用的情况下,资源配置不受法律规定影响的观点也表明:在正交易费用的情况下,法律在决定资源如何利用方面起着极为重要的作用”(科斯,1994,322),但是即使是零交易费用情况下,并非一定能实现帕累托最优。联系前述森的例子,吉巴德(Gibbard) 和凯莱(Kelley)等人基于一个强烈的契约自由的自由主义传统,主张人们的可让渡的权利(alienable right)即 放弃权利的权利(right to give up right)。在这个故事里,李四可以向张三保证他会看这本书以换取张三的不读它,这样通过自愿的权利转移实现了帕累托改善。但问题是这个弃权方法也只是在包括此例的一部分问题中有效,在很大一类情形下就没有合适的社会选择结果了。并且它的能否执行是成问题的,因为,在缺少信息透明度(如没有有效的“法庭”来确认)的情况下显然两个人都有动力违背这个契约。显然,交易费用尚未成为一个可测度的概念,而外在的“法庭确认”以及广义的“制度运行成本"(阿罗)应属交易费用之列。
现在我们回到前面提出的问题,结合机制设计理论的其他成果,我们可以更好地理解它了。完全集中决策体制确立的社会目标即使是合意的,也是难以企及的,在执行中会遇到来自信息和激励两个方面无法解决的困难。“如果有一些全知全能的人,如果我们不仅知道那些影响我们获得现在想要东西的因素,而且知道我们将来的欲望和需要,那么自由就没有什么地盘了。为了给不可预见和不可确知的事物留有空间自由是不可缺的。所有自由的制度都是对这个基本的无知的事实的适应,以处置机会和可能性而不是确定性。”(Hayek, 1960, p29)
现在我们简要考虑一下更深层的保证制度得以执行的制度问题,即应该提供足够的激励,使制度执行者在追求自我利益的过程中也实现我们(作为制度设计者)希望的社会整体利益。从机制设计的角度可以把问题具体化为这样一个激励问题,即,人类社会如何选出制度执行者,以及如果他们是自利的,容易利用自己的执行权力损害社会利益时,如何设计一套制度监督约束他们。用委托代理(principle-agent)理论的框架来表述,那就是:我们不具有某种特殊的知识,只好委托一些人代理某些事情。我们凭什么知识筛选识别出宣称自己拥有这种知识的代理人呢?我们又凭什么制度使这些代理人不会利用自己的特殊知识作出损害我们的事情呢?。
既然我们不能改变人们追求自我利益的本性,我们就不能寄希望于我们会幸运地遇到利他主义者这样一种小概率事件。我们的制度必须从这样一种假设出发:如果我们的代理人是个利己主义者,我们如何在他追求自我利益的同时不致损害我们的利益,进而让他的追求个人成功和个人福利的行为最大程度地为社会服务。于是,途径也就很明了:一是我们要尽量保持信息的通畅,使得言论和新闻出版自由成为对执行权力的监督;二是从委托-代理理论可以得到的启示是,我们不仅可以利用事后罢免的“威胁”激励制度执行者在实现自我利益的同时,为委托人的利益服务,而且可以设计一个“代理人市场”,让代理人之间的竞争而不是“联盟”产生自动的激励,这可以认为是西方多党竞争,三权分立理论的一个说明。孟德斯鸠也早就说过:“从事物的性质来说,要防止滥用权力,就必须以权力制约权力”。所以,良好的制度必须赋予人民挑选制度执行者的权力,而在后者不具备才能或假公济私的时候还有罢免他的权力。道理很简单,人民可能不是很具备制度知识,但他们具备鉴别制度执行者行为后果是否对他们有利的知识,并且他们至少具有学习能力,会以“干中学”的方式不断充实他们的制度知识。
机制设计理论的着眼点不仅是要指出种种不可能性的困境,更重要的是要提供具体环境下走出困境的途径。人类创造了很多能够诱导人们显示并测度他们的效用的技术和制度,如拍卖和招标投标制度;也有很多理论对各种经济环境设计出了相应的激励机制,如克拉克-格罗夫斯-莱德亚德机制;很多局部的效用测度和比较也是可行的。人们有充分的理由否定完全的集中决策,也会明智地让个人决策受到某种集体意志的约束而避免完全的无政府状态。人类社会的现实选择本来就是理性设计和个人自由发挥的结合,二者之间的界限和结合方式是随着知识的积累和技术的进步而不断发展变化的,而不同的界限和结合又直接影响着人们能够得到什么样的知识和技术。这是一个问题不断产生又不断得到解决的复杂过程。而这也使我们自然进入了制度变迁的领域。
进化经济学与制度变迁理论
当我们讨论机制设计的时候,是假设逻辑上有无穷多种机制可供选择,一个社会技术上也能够随心所欲地选择制度。但经验上一个社会可选择的制度是非常有限的。进化经济学与制度变迁理论试图对社会的制度选择作出更细致的刻画,以解释历史上那些特殊制度的产生与发展。
制度变迁理论的基本分析框架是建立在制度、知识(技术)、信息、博弈上的。如果我们以知识笼统地概括知识、技术和信息(知识和技术的区别类似于理论和应用,我们不作严格区分,而从信号中提取信息则是由知识和技术决定的),那么人类社会的组织运作方式自本能经由习惯向制度的演化过程中,知识与知识进步扮演了一个关键角色。作为自然进化过程中的产物,人类总是在与外界(自然、社会和他人)进行着博弈,他的博弈工具实际上就是他的知识。制度也不过是一种特殊的知识和技术而已。一方面,制度和人的知识与技术一道决定着游戏的玩法(策略),知识与技术决定了所有可能的玩法,信息筛选掉了不必要的玩法,而制度告诉你不能采用的玩法;另一方面,制度还是一个被玩的对象。在决定一个游戏规则的游戏中,有的社会只让一个人玩,有的是一小群人来玩,有的是所有人来玩(原则上,博弈论的观点认为是每个人都参加的,只不过更基本的玩法(制度)决定了谁有资格玩或者说谁说话的份量更重);有的社会是以投票的方式来玩,有的是以钞票发言,有的甚至是用刺刀和机枪来表决的。而所有这些行为,在行为者本人看来,都是在他更基本的技术和信息范围内的最佳选择,否则他就不会这么作。
政治法律制度的产生发展,反映了人们的制度知识以及关于“制度的制度”的知识的变迁。为了在竞争的个人实现自我价值的同时使社会的共同利益得到实现,避免“囚徒困境”所揭示的个人理性和集体理性的冲突,人们从经验中认识到社会需要制度和制度的执行者,用以规范个人行为或提供公共产品,由此出现了社会的公共管理部门或曰公共权力部门;当然人类社会之复杂性也会使得公共权力部门及其人员有可能或因其自利行为,或因其知识之不足,而损害社会的整体利益,由此引申出如何规范约束公共权力部门的问题,于是宪政知识与宪政制度被人们所追寻、设计并得以建立、发展。
人类政治法律制度作为一种知识的高度凝聚,探讨人类社会整体应该实现的价值目标(社会选择),解释并预测社会个体和团体,尤其是公共权力部门是如何活动的或可能如何活动(博弈理论),指出为了实现社会目标应该采取什么行动即制定什么样的相应制度(机制设计)。进一步说,宪政制度作为政治运作的一种知识和技术的表现,还取决于那些更深层的习惯和传统(包括人们基本的生活方式、思维方式及宗教与道德等)。因为人们是生活在传统和习惯赋予他们的经验中的。当然,现实中的任何社会,其制度知识都是不完备的,因而其发展表现为一个动态演进的复杂过程。
由于人们的生活方式和对自然、社会、人生的思维方式的区别,每种社会的具体制度选择也各有差异,并且这种差异会由于人们对其已有经验和知识的依赖而得到强化,使得不同社会的结构形态和实际运作千姿百态。那些稳定下来的制度以及相关的知识,给生活在制度下的人们以足够的信息,使他会预期到自己的行为选择的后果,不会轻易选择制度所不允许的行动方式,更难得主动去改变现行制度(因此我们在古今中外会发现许多低效率的制度竟然有着持久的生命力)。制度和制度调整下的行为就这样形成一个自增强的稳定的“鸡生蛋、蛋生鸡”的循环机制,即所谓的路径依赖(path-dependent)和锁定(lock-in)效应(Arthur, 1990)。也就是说,最初的选择决定了后来的整个过程。特别地,对于一个变革社会而言,这种路径依赖和锁定效应,大大增加了学习其他文明成果、推动社会制度变革的难度和变革过程中的波折。那些微小的变革努力在这种封闭社会中,只会被消弭于无形。社会结构和制度的突变和跃迁,只能取决于其内部的强烈震动或外部的巨大冲击。但是我们必须区分那种仅仅是表现为利益再分配形式的突变,即便它是如何的轰轰烈烈。我们未必完全赞同“个人拥有现状不可侵犯的权利作为基本的公理(Buchanan,1962,371-384)”,但我们也可常见,如果没有辅之以人们观念和知识上的变革准备,那些想毕其功于一役的大变动要么是不可行的,要么徒增社会震荡而后又被传统和习惯所拉回。。
强调传统文化和习惯的力量并不是否认发生制度变革的可能性。 这里有必要讨论一下哈耶克“合作秩序的扩展”的概念。哈耶克把西方社会与市场经济相关联的一整套制度的发展过程理解为“人类合作的扩展秩序”(Hayek, 1988)。粗看起来,非西方社会欲学习西方的自由市场和多元民主制度都表现为发展中的不连续,是一种原来秩序的中止,哈氏的逻辑是很难解释清楚这种学习的可行性的(这并不意味着两者一定是冲突的)。一个社会的制度与知识是分层次的。
我们的知识和制度都是长期进化的产物,生存使我们知道如何运用知识实现某个目标,进化要求我们能够判断并决定(这种判断据以作出的知识是一种元知识)哪些知识是应该丢弃的,哪些是该坚持的,哪些是该学习的。也就是说,我们的知识区分为基本的与派生的,前者是相比较更稳定的,后者附丽于其上但有相对的独立性(否则应该是同一层次的),在现实里最基本的知识是那些直觉性、本能性的东西,是历史赋予我们且经过时间考验而得以保持的稳定知识,就象最基本的制度是自然规律一样[哈耶克认为,“自发社会秩序立基于下述两种规则:第一种是先天的,遗传继承的关于人的行为的普遍规则,它们形成于人种的生物进化的过程;第二种是习得的,文化传承的关于人的行为的规则。”第一种构成所有社会科学不言而喻的前提(Hayek, 1973)。改变那些派生的知识或制度是简单的,而改变相当深层的更基本的东西困难则要大得多,那需要更多的时间和学习。一种新思想理论的引入,或者说一种新观念的被接受是一个长期的过程,足够长的时间会使它们最终能够跳出传统和习惯的束缚。
另外,强调过去历史的决定作用也并不意味着,否认社会个体的能动性和变革过程中的偶然性。制度对个体的约束是有限的,这种约束建立在个体对他人行为的预期和对违反制度行为的风险的判断上。在已有技术和知识准备的前提下,个体主动的奋争和偶然的试探行为有可能生长发育到主导全局的结果。路径依赖本身就说明,偶然性在事物发展的临界点上往往会起着关键性作用,甚至影响了不同的历史进程。只不过这个过程是复杂的,其路径不会那么简单明了。
从机制设计理论我们知道,评价一个制度的效率时往往从激励和信息两个方面来衡量。前者要求制度应能使个人在追逐自我利益的同时,有动力实现制度设计者所希望达到的对整个社会有利的目标,而后者则要求制度运作所需知识的复杂度不会超出社会整体知识水平之上。所以,仅仅知道什么制度是好制度无助于在实践中实现这种制度,仅仅知道一个事物的存在与把它具体构造出来所需要的知识的复杂度是不一样的。那些稳定制度背后都有一段漫长的历史,维护制度的“制度”或知识正是从历史中经过反复试错学习到的。制度的存在性和稳定性是依赖于那些基础性知识的存在性的,博弈论围绕囚徒困境的研究尤其表明,合作制度能够抵挡住非合作行为的诱惑而创生并巩固下来,是建立在关于他人能够合作的知识和信念上的。
对于一个致力于制度创新的过渡社会来讲,这就要求制度变革的发起者,全面把握传统思想和现实力量对个人和各种组织行为的作用,从社会知识结构最深层里寻找新制度的生长点,在个人自利性、对策性行为导致的纷繁复杂的可能性中找到真正有效的实现途径。
--------------------------------------------------------------------------------
参考文献
Kenneth Arrow, 1951,1963, Social choice and individual
value, Weiley press cooperation.
Arthur, W. Brian, 1988,“Self-reinforcing Mechanisms in
Economics”, in Philip W. Anderson, Kenneth J. Arrow , and David Pines (ed.)The Economy as an Evolving Complex System", Reading, MA..
Addison-Wesley.
Robert Aumann, ed., Handbook of game theory and applications, North Holland
Press, 1994.
Robert Aumann, What is game theory trying to accomplish?in Kenneth J. Arrow and Seppo Honkapohja (ed.),1985, Frontiers of
economics, Basil Blackwell Ltd..
Robert Aumann, Game theory, in John Eatwell, Murray Milgate & Peter
Newman(eds.): The New Palgrave: A Dictionary of Economics, vol. 2, The
Macmillan Press Limited, 1987.
Ken Binmore: Playing fair: Game theory and the social contract (volume I), MIT,
1994.
Black, D., 1958, The theory of committees and elections. Cambridge: Cambridge
university press.
Buchanan,James, M. (1959), Positive economics, welfare economics, and
political economics. Journal of law and economics 2 (October): 124-138.
Buchanan,J.,M., Stubblebine, W. Craig (1962). Externality, Economic 29
(November): 371-384.
布坎南,《自由、市场与国家》,北京经济学院出版社
Ronald Coase: The problem of social cost, Journal of law and economics 3(1),
1-44, October, 1960.
Edgeworth,F. Y. (1881), Mathematics psychics, London: Kegan Paul.
Fudenberg and Tirole, Game theory, MIT Press,1991.
Allan Gibbard: Manipulation of voting schemes: A general result. Econometric
41: 587-602, 1973.
John Harsanyi: Cardinal utility in welfare economics and in the theory of risk
taking, JPE 61, 434-435, 1953.
John Harsanyi: Cardinal welfare, individualistic ethics, and interpersonal
comparisons of utility, JPE63, 309-321, 1955.
John Harsanyi: Games of incomplete information played by Bayesian players, Management
Science 14, 159-182, 320-329, 486-502, 1967-1968.
F. A. Hayek, The constitution of liberty, London: Routledge & Kegan Paul,
1960.
Hayek, Studies in Philosophy, Politics, and Economics, Routledge and Paul.
1967. P92.
F. A. Hayek, "Law, legislation and liberty: rules and order(I)", The
University of Chicago P ress,1973.
Hayek, The Fatal Conceit, University of Chicago Press, 1988.
霍奇逊《现代制度主义经济学宣言》中译本,北京大学出版社,1993年。
Hurwicz: On informational decentralized systems. In Decision and organization,
ed. R. Radner and C. B. McGuire, 297-336. Amsterdam: North-Holland Publishing
Co. 1972.
Leonid Hurwicz,“Incentive aspects of decentralization”,in Kenneth J. Arrow and
Michael D. Intriligator(eds.)“Handbook
of mathematical economics”(vol.3),North-Holland
Publishing Company,1986.
Laffont, ed., Aggregation and revelation of preferences, North Holland Press,
1979
罗纳德,科斯:论生产的制度结构,上海三联书店1994年。
Ludwig von Mises, Liberalism in the classical tradition, 3rd ed., San
Francisco, CA. Cobden press, 1985
丹尼斯·缪勒《公共选择》,商务印书馆,1991年。
John F. Nash: Non-cooperative games, Annals of Mathematics 54(2), 286-95,
September 1951.
Appendix: Motivation and Interpretation, from doctoral thesis, Princeton
University.
道格拉斯· C·诺斯《制度、制度变迁与经济绩效》中译本,上海三联书店出版,1994年。
Charles R. Plott: Rawls'stheory of justice: an impossibility result, in Hans W.
Gottinger & Werner Leinfeurer (ed.s): Decision theory and social ethics
issues in social choice, D. Reidel publishing company, 1976.
John Rawls: Justice as fairness, Philosophical Review LXVII, 164-194, 1958.
John Rawls: A theory of justice, Harvard University Press, Cambridge, MA, 1971.
John Rawls: Concepts of distributional equity: some reasons for the maximin
criterion, American Economic Review LXIV(2), 141-146, 1974.
Charles K. Rowley(ed.): Social choice theory, vol. I , II, III, Edward Elgar
Publishing Limited, 1993.
Robbins, E. S. (1935), An essay on the scope and nature of economics science,
2nd ed., London: Macmillan.
Samuelson, 1954, The pure theory of public expenditure, Review of economics and
statistics 36, pp387-9.
Amartya Sen: Impossibility of a Paretian liberal, JPE 78, 152-157, 1970.
Amartya Sen: Social choice, in John Eatwell, Murray Milgate & Peter
Newman(eds.): The New Palgrave: A Dictionary of Economics, vol. 4, The
Macmillan Press Limited, 1987.
田国强,1995,《经济机制设计理论与信息经济学》,载《经济学与中国经济改革》,北京大学中国经济研究中心编,上海人民出版社。
______________________________________
公法评论http://gongfa.yeah.net
mountainsf@sina.com
founder32@yahoo.com)