陈潭：公共政策变迁的理论命题及其阐释

［摘要］公共政策变迁是一个颇具诱惑力的研究领域，在这方面的理论探讨和实证分析都有必要加强和深入。为了厘清政策变迁的基本理论，本文依据变迁时序和表现形态建构了“政策时滞”、“政策博弈”、“政策演进”三个理论纲要，并在三个理论纲要下尝试性地提出了9个基本的理论命题。其目的在于揭示和阐述公共政策变迁的内在逻辑，同时也说明公共政策变迁的自变量和因变量所建构的变量系统的复杂性，对于公共政策认知、规划、设计、实施与评估具有相当的学术价值和应用价值。

［关键词］政策变迁理论命题政策时滞政策博弈政策演进

一、政策时滞

hysteresis一词来自于希腊语，意指“之后发生什么”，后来学术界经常用“时滞”或“滞后”来表达，说明尽管一个时点的冲击已经消失，但这个冲击的影响仍然会保留在体系内部。物理学家詹姆士•阿尔佛莱德•尤因（1855—1935）1885年在一篇关于电磁的论文中首次提出了时滞这个概念。要是一根电线绕在一根铁棒上，让电流通过电线，铁棒就变得有磁性。尤因注意到，即使电流被切断，有一些磁性仍然滞留在铁棒上。铁棒受到磁循环（电）刺激并具有了某种状态（变得有磁性），而且即使导致这种状态的因素（电）被切断这种状态仍然能够保留下来。尤因把这种现象称为时滞。由此，尤因把这种现象简洁地表述为：

当存在两个量M和N，N中的一个循环变化引发了M中的一个循环变化，由此在M中发生的变化总滞后于N中发生的变化，时滞就发生了。在任何一个时点上M的值不仅仅依赖于N的实际值，而且也依赖于所有前面N中发生了的变化。［1］

格尔塔•托尔思维克（Gaute Torsvik）对尤因电磁时滞理论作了具体的解释性模型分析（见图1），该图式化模型表明：我们从A点开始，要是一个正的磁化能量导入铁中，铁就会变得具有磁性，就如B点所示。移去磁化能量后，铁的磁性并没有消失，铁仍然保留着相当于C点的磁性。这就表明磁性不仅仅是过去铁的历史的函数，也是此后对铁产生影响的磁化能量的函数。假设电流冲击为X，铁的反应为磁性Y，那么可以把这种关系描述成函数关系式为Y＝F（X）。在社会或经济系统中，Y通常代表个人的行为（或个人行为的集体措施），而X代表外部基本条件——比如价格、技术条件等等——也就是所有影响这些行为的相关变量。时滞命题对于我们理解和分析资本市场的不可逆投资效应、劳动力市场上失业的吸收效应、消费行为的内生偏好效应等经验现象具有很强的解释力，对于政策变迁的不可逆性和政策安排的滞后性同样具有不可替代的理论启迪和经验解释效果。

命题1：政策变迁具有不可逆性，而且必然充满着“政策记忆”。

公共政策变迁是从“旧”的政策向“新”的政策转变的过程，也是从“坏”的政策向“好”的政策转变的过程，因而变迁的方向具有当然的不可逆性。辩证唯物主义表明，事物是发展的，事物发展是前进性和曲折性的统一；历史唯物主义也表明，人类社会的历史是由低级到高级、由简单到复杂的发展过程。指导人类社会发展的公共政策也不例外。从宏观的发展过程来看，公共政策就是一个从无到有、从旧到新、从恶到善的安排过程。时间是流动的，政策是不可逆的，犹如铁棒上的电流很难重新回流到已抽离的电线一样，亦如一个人不可能“越活越年轻”。但是，一个人的经历以及对生活实践的阅历却是无法抹去的，无论如何他对生活总是充满记忆的。公共政策也一样，新政策是建立在旧政策基础上的，倘若没有“旧”又何以有“新”呢？显然，政策变迁是一个具有相当承传性的延续过程，政策充满着记忆。政策记忆（policy memory）是政策运行的继承性认知，是政策现实和政策理想转化中的政策回味，它充分反应着政策变迁的历史痕迹，而且不可避免地呈现着政策变迁中的路径依赖。

假设一定的政策情景时点为t，那么政策变迁必然沿着t+1、t+2、t+3…t+n路径顺时序前进，它决不会反其道如t-1、t-2、t-3…t-n般的逆时序而行之；但是，在作政策转换或政策替代时，政策相关利益人却不能不涉及和考量时点t-1或t-2或t-3或t-n的政策积累。从一般意义上来说，一项良好的处于时点t的政策制定，至少既要预测时点t+1的情况，又要顾念时点t-1的情形。因此，变迁中的政策安排必然立足现实、回顾历史、取向未来。此外，我们必须明确政策变迁的不可逆性并不否定政策某一时点上的逆向选择性，那就是由于变革成本的昂贵性、信息的不充分性、问题的复杂性、利益集团的抗力性、环境的不可确定性等因素的存在，政策可能会出现“向后转”的现象，但是相对于政策的长时段来说这只是暂时的；政策某些时段所出现的反复和“折腾”，也可能是政策组织者有意图的“试错”历练，是政策推广前政策试验所允许的可能范围。由此，政策选择可以是可逆的，而政策变迁则是不可逆的。

命题2：政策变迁具有相当的惯性和惰性，而新政策的安排亦通常居于滞后。

我们知道，政策变迁必然是一个过程。所谓“过程”，指的是事物状态的变化在时间上延续和空间上延伸。在政策变迁这一长久的过程当中，如果政策记忆长久地保留且“抹之不去”，并不断地强化原有政策意图和集体行动选择，那么这就说明旧政策变革的阻力相当强大，其所具有的惯性一时半载挥之不去，政策变迁的惰性也随之明显，这就是政策变迁所谓的“路径依赖”。政策时滞性这种客观的非人为原因所形成的惯性以及人为原因所形成的惰性，它有可能一度阻止新政策的安排和实施。也由于惯性和惰性的存在，因而必然较多地使用诸如“双轨制”之类过渡性体制安排——旧政策得以保留和新政策得以试验，于是政策变迁过程中体制之间的摩擦和耗损不断增加，从而导致变迁成本加大和整个社会的效率缺失。

同时，政策变迁中的政策供给往往是滞后的。从公共政策过程的环节来看，政策问题是整个政策过程的起点。只有发现了政策问题或者认识了政策问题情境，才可能有政策的相关安排。由问题发现到政策安排，本身说明这是一个有先有后的逻辑过程，同时也是符合人的认识过程的，因而政策安排的滞后性便自然而然。制度变迁的研究表明，就正常逻辑看一项新制度安排一般具有滞后性［2］。马克思生产力和生产关系的制度变迁理论模型也充分地阐明了这一点，马克思认为，制度变迁是对生产力滞后的反应，此时的制度安排是对彼时生产力水平的回应。制度变迁的诺斯模型也是一个“滞后供给”模型，即在潜在利润出现和使潜在利润内部化的创新之间存在一定的时间间隔，即制度创新滞后于潜在利润的出现。假设我们现在处于时点t上，要制定时点t的政策，那么这时的政策情景是建立在时点t-1的基础上的；当我们把时点t的政策制定出来了，可我们的时点又跨过了t+1甚至t+n的阶段；我们极力地想把政策制定得富有前瞻性和超前性，希望时点t的政策能够涵盖t+1、t+2、t+3…t+n等未来时点，但这往往又是不可能的。因为时间是流动的，政策情景是可变的，未来具有不确定性。于是，时点t的政策安排依据的是时点t-1的政策情境，而在实施中时点又可能跨越了t＋1的阶段了。

命题3：政策时滞的长短与政策变迁的变量相关，且贴现率高低也呈现不同变化。

诺斯将制度变迁中的时滞从以下四个方面加以解说，即认知和组织（时滞1）、发明（时滞2）、菜单选择（时滞3）、启动时间（时滞4）等。诺斯认为，在时滞1中，一种安排创新中得到的潜在利润越大，时滞就越短；已知的合法安排选择单子愈长，时滞就愈短；组成有关行动团体的成员越少，时滞将越短；如果组成有关行动团体的成员的原型组织已经存在的话，时滞将缩短；通讯和交通条件愈好，时滞将缩短。在时滞2中，从创新安排中能够实现的利润愈大愈确定，发明时滞将愈短；以完整形式运用制度的发明，时滞将缩短；基于法律和政治环境的经济安排愈可靠，发明的时滞将缩短；经济环境对可能选择的方案的制约愈小，时滞将就愈短。在时滞3中，菜单上可行的安排选择数目愈多，时滞就愈长；呈现在菜单上的选择方案的现值分布愈大，时滞将愈短；对外部利润内部化至少能起部分作用的现存安排的总成本部分愈大，时滞愈长。在时滞4中，不论是个人安排、自愿组织合作安排还是政府性安排，潜在利润愈大愈确定，启动时间愈短。［3］

同理，政策时滞的长短与政策变迁的内在变量和外在变量是相关的。政策时滞与内在变量中的公众的认知程度、组织的推力大小、决策的好坏快慢、方案的数量选择、利益集团的势力强弱、资源投入的效益状况等密切相关。比如，公众对政策的认知水平和理解程度越高，政策时滞就越短，政策贴现率就高；政策组织的凝聚力、决策力与执行力越高，政策时滞就越短，政策贴现率就越高；决策的科学化程度愈高，决策的缺陷愈少，政策时滞就愈短，政策贴现率就愈高；政策方案的选择愈多，菜单数量愈多，启动时间愈长，政策时滞就愈长；政策资源投入的效益越高，潜在利润率大，政策时滞就越短，政策贴现率就越高等等。政策时滞也与外在变量中的意识形态、政治法律、科学技术等环境因素相关，比如，意识形态的限制越多，启动时间就越长，政策利润的现值分布越小，政策时滞就越长；政治法律环境的制约越小，政策时滞将越短，政策贴现率就越高；科学技术越进步，人类理解和认识能力越提高，政策时滞就越短，政策贴现率就越高。由此，政策时滞的状况与政策变迁的变量呈现正负相关关系，政策贴现率也就随着时滞长短而呈现高低的差异。

二、政策博弈

博弈论英文为gametheory，是研究决策主体的行为发生相互作用时候的决策以及这种决策的均衡问题。［4］博弈理论假设博弈参与者（局中人）均为“经济人”，即理性的自利者。作为公共物品的公共政策，是“与私人选择相对的公共选择”［5］，是集体行动的要求和必然。那么，按照博弈论的解释，作为集体行动的政策变迁便是一个由众多局中人参与的互动博弈过程。在政策变迁的博弈场域当中，博弈参与者或局中人包括政党、官僚、利益集团、公民个人等；博弈预期则是可控的或不可控的政策利益，其中包含物质利益和精神利益两种；博弈规则是参与博弈的外部所能提供规则，包括意识形态、经济制度、政治法律环境等；博弈策略是局中人所选取的竞赛技术和方法；博弈方式主要表现为合作博弈（cooperativegame）和非合作博弈（non-cooperativegame）两种。由于有着不同的显示偏好、预期利益、知识水平、技术信息等，政策参与者之间的博弈铸造了政策变迁的人为动力，政策变迁实际上就是一种动态的政策博弈。由于集体行动的逻辑，人类理性与政策公共性之间的矛盾始终存在，因而博弈所引发的政策悖论（policy paradox）现象也不可避免。

命题4：政策变迁的过程必然是一个转轨的过程，合作博弈达成的“双轨制”成为一定时期内的可能模式。

政策变迁是采取激进的或休克的策略方式还是渐进的或平滑的策略方式，主要在于博弈参与者的理念、经验、智慧和政策环境的制约程度。但不论如何，“转轨”（transition）已是事实，而为了避免剧烈的政局动荡，一般来说平滑式的渐进变革是其理性的选择，这是由于变革代价和改革成本的算计使然。同时，也是社会再生产的连续性所决定的。再生产的连续性是指“在转轨过程中必须在相当长的时期内保留旧的经济形式”［6］，这就要求在某一时期内对生产结构的保留，对现有部门内部和部门之间的联系、对政策连续性等方面的保留。任何期望迅速取代旧的政策的做法，都将不可避免地使生产过程或社会发展带来混乱、扭曲甚至衰退。因此，博弈参与者为了既得利益和预期利益只能走向“合作”——政策交易和政策妥协——一种新旧政策并存式兼容型悖论出现了，有限理性促使他们作出了不是“最优”而是“次优”的选择——双轨制过渡性政策安排。因而，政策变迁呈现出二元结构模式，政策变迁轨迹亦显现出平滑滚动的鲜明特点（见图2）。

中国经济改革的一个最突出的特征就是市场化过程中的双轨制模式。该模式首先出现于价格改革领域，即所谓“价格双轨制”，计划价格和市场价格同时存在，具体表现为“一物两价”。在这种思路下，局部放松原先价格的绝对计划控制，在计划边界之外允许价格自由浮动，使定价制度从单一价格控制过渡到计划控制与市场控制共存的双轨价格制度。后来，这种双轨制模式逐步延伸到经济、法律、社会等许多政策领域。实际上，双轨制所反映的是旧政策、旧体制与新政策、新体制的一定时期内的利益合谋，也是博弈参与者在合作博弈条件下妥协的产物。由于再生产的连续性、转轨过程的深刻继承性、社会生活准则和思想观念调整的缓慢性，这就决定了政策变迁的“转轨”过程的渐进性和相对长期性。但是，我们必须看到这种“双轨制”不仅增加了政策体制之间的摩擦和耗损，也会产生并强化新生的利用双轨制寻租的既得利益集团，从而导致政策效率损失和改革成本及改革难度增大。因此，治国者要想转轨成为一个平滑、连续的过程，就必须时刻注意在改革的每一步尽量减少政治的交易成本，力求获得更多的政治支持，以增加改革的可接受性；而不是一味地寻求“效率最大化”或“最优目标”。［7］

命题5：由于集体行动的逻辑，政策变迁容易出现如同“公用地悲剧”般的非合作博弈困局。

古希腊哲人亚里士多德（A.Aristole）曾经断言：“凡是属于最多数人的公共事务常常是最少受人照顾的事务，人们关怀着自己的所有，而忽视公共的事务；对于公共的一切，他至多只留心到其中对他个人多少有些相关的事务。”［8］ 1968年英国科学家哈丁（G.Hardin）在美国著名的《科学》杂志上发表了《公用地的悲剧》（The Tragedy of the Commons）一文，描述了理性地追求最大化利益的个体行为是如何导致公共利益受损的恶果［9］。美国经济学家奥尔森（M.Olson）演绎的“集体行动的逻辑”（The Logic of Collective Action）也说明个人理性不是实现集体理性的充分条件，其原因是理性的个人在实现集体目标时往往具有搭便车（free-riding）的倾向。奥尔森认为：“尽管集团的全体成员对获得这一集团利益有着共同的兴趣，但他们对承担为获得这一集体利益而要付出的成本却没有共同的兴趣。每个人都希望别人付出全部成本，而且不管他自己是否分担了成本，一般总能得到提供的利益。”［10］而在政策变迁过程中，非合作博弈条件下集体行动的逻辑也不可避免地存在着。

集体行动的困境说明，集体行动未必能导致集体利益或公共利益，在由n人所组成的公共事务管理中便是如此，比如集体行动困境可以导致公共产品供给短缺、公共资源利用无度、公共秩序混沌失序、公共组织效率缺失、公共政策执行失范等。［11］公共政策作为一种公共物品也无法消除它的外部性，在政策变迁中我们常常可以见到这样一种悖论状态：既存政策是多数人不满意的，但这种不满意的政策又能够较长地维持。因为理性的个人都存在着“搭便车”的动机，每一个人只想获取最大化的1／n的收益（假设存在n人的集体），却不愿承担哪怕最小化的1/n的成本。于是乎出现了一些“怪状”：一则你有你的政策、我有我的行动，理性的算计只顾追求自己利益的最大化，新政策的推行成为了一纸空文，个体理性导致了政策的非理性，于是这部分人便成了政策变迁中的个人主义者；二则对于受益型政策希望别人能够“示范”、对于受损型政策希望自己能够逃脱损亏，于是乎等待观望、伺机寻利、伺时出击，这些人也就顺其自然地成为了政策变迁中的机会主义者；三则虽然这个政策不合理，但分摊到个人身上的损亏是相对较小的，人们宁愿忍受这个不合理的政策，也不愿去创新一项从整体来说收益更大的政策，于是这部分人便成为了政策变迁中的保守主义者；四则不论是新政策还是就政策，对于个人来说两相比较收益或损亏差不多，于是“随便”、“无所谓”便成为了口头禅，这部分人实实在在地沦为了政策变迁中的旁观主义者。布罗姆利认为，“制度作为限制、解放、扩展个人行为的集体行动，是界定消费集和生产集的根本因素。导致选择集（不管是消费还是生产）改变的集体行动必然总是在一给定的制度安排结构中进行”［12］。

命题6：政策变迁是一个将政策受益由零和博弈转向非零和博弈的重复博弈过程，而政策结果形态便是一种纳什均衡。

按照博弈理论，零和博弈指的是博弈中一方所得是另一方所失，但博奕得益之总和为零；非零和博弈则相反，一方所得并非另一方所失，而且都获得了增量收益，其得益总和不再为零；重复博弈指的是“某些博弈的多次（两次以上，有限次或无限次）重复进行构成的博弈过程”［13］；纳什均衡指的是在给定其他人战略的条件下，每个人选择自己最优的战略，并由所有参与人最优战略组成一种战略组合。理解这些概念的意思，实际上也就理解了该命题的含义。在政策变迁中，有一类参与人不是去增进整个政策的新收益，而是在现有政策中争取自己最大的份额，于是他的收益是以另外一部分的利益减少为代价的，于是成为了一种零和博弈的政策形式，“寻租”（rent-seeking）成为这一政策中的普遍现象。而在另一种非零和博弈状态下，参与人都去增加社会的总收益，或部分人的新增利益至少不是建立在另一部分人利益减少的基础上的，公共政策处于博弈参与人的合作状态。但是，由于参与者拥有的不完全信息，一次博弈并不能使政策处于各方满意状态，它需要多次重复博弈，并掌握相对充分的信息，才能达到一种纳什均衡。所以，政策变迁就是一个将政策受益从零和博弈转向非零和博弈的重复博弈过程［14］，也是一个由非合作走向合作、由不完全信息走向相对完全信息的重复博弈过程。

囚徒困境模型可以进一步说明。假设两个合谋的犯罪嫌疑人被警察逮住，分别被关在互不通信息的房间内进行审讯。警察告诉他们：如果两人都坦白，则各判刑5年；如果一人坦白一人抗拒，则坦白者释放抗拒者重判8年；如果两人拒不认罪则以妨碍公务罪各判1年。我们可以用一个特殊矩阵表示如下：

对该博弈中的两个博弈方来说，各自有两种可供选择的策略即坦白和抗拒。共有四种可能的结果，其中最好的得益是0，最坏的得益是－8。事实上，（坦白，坦白）不仅是A、B两个的占优战略选择，而且也是一个纳什均衡——各判刑5年，因为他们都不想要判刑8年。而（抗拒，抗拒）虽然是最优战略选择，可是它不满足个人理性要求，即使订立攻守同盟也没有激励去遵守协定。囚徒困境反映了个人理性与集体理性的矛盾（命题5所讨论的问题），同时也引申了一个重要的结论即“一种制度安排要发生效力，必须是一种纳什均衡，否则，这种制度安排便不能成立”［15］。

三、政策演进

根据发生学的研究视角，政策变迁即政策演进，而政策演进的动力来源于政策需求和政策供给的矛盾运动，于是政策演进通常表现为失衡—→需求—→供给—→均衡的逻辑演绎模型（见图4）。按照交易成本（transaction cost）理论，政策或制度的产生源于交易成本的降低或潜在利润的获取（按照公共政策理论，问题的存在是政策产生的逻辑前提），政策演进就是交易成本最小化、政策收益最大化的过程。政策需求、政策供给、政策成本、政策收益等概念是政策演进必须依赖的关键词，同时也是政策经济学［16］所要揭示和叙述的基本内容。而政策需求和供给均为政策成本和收益的函数值比较使然。此外，政策的需求与供给也与制度环境的状况有关。政策演进的历史与实践表明：社会发展越是迅速，政策供给越要及时和有力，在体制空白和法制缺乏的地方，政策供给更为重要［17］。

命题7：政策需求主要源于政策的收益函数比较，而强制性的国家主导型模式是政策供给的主要模式。

对政策安排的需求基本上源于这样一种认识：按照现有安排，无法获得潜在的利益。如果在现有政策条件下，不能满足成员的要求，其成员便试图改变现有政策，从而谋求新的政策。由此，假设政策主体效用函数不变的前提下，政策需求可以视为收益的函数，表示为：Di＝f(R-Ř)，约束条件R＝g(T,M,EX,Ga…)。其中，Di代表政策需求，R代表潜在收益，Ř代表现存政策中可实现的收益，可视为一个常数；R受技术（G）、市场规模（M），预期收入（EX），政治及经济游戏规则（Ga）影响。那么当R< Ř时，需求为负，说明并反映现存政策可实现的受益范围仍有余额，意味着现存政策处于内部完善、提高利用度的阶段；当R＝Ř时，需求为零，表明全部潜在收益都在现存政策中得以实现，政策处于均衡阶段；当R> Ř时，需求为正，表明有部分收益（R—Ř）无法在现存政策中实现，从而引起了新的政策安排需求。因此，“一旦对于行为者来说创立和利用新的制度安排的净预期利益为正时，他们就会要求有这种新的安排”［18］。

政策收益函数比较引致的政策需求是政策变迁的内在推动力，也是诚如哈耶克所谓的“自然秩序”使然；而国家主导型政策供给则成为了政策变迁的主要外在推动因素，也是“人为秩序”的强制性制度表达。虽然存在着“诺斯悖论”［19］的可能，但国家（政府）仍然是政策变迁的主导供给力量。这是因为：第一，政策作为公共物品，其有效供给是国家基本而又必须的职能。公共物品具有供给的无偿性和消费的排他性特点，私人不愿也无力承担这种容易引致“搭便车”行为的非竞争性物品，因此它成为了国家公共事务担负的必要性依据。第二，国家主导型供给模式能够有效地降低交易成本，使政策安排优化成为可能。因为国家拥有相对较多的资源和力量，能够产生供给的规模效应，从而有效地节约交易成本。第三，国家有行使暴力工具的权力，能够调和利益集团等诸多政策主体之间的矛盾，克服集体行动的困境和利益独占现象，从而有效地减少社会的震荡，保持政策的均衡和社会的稳定。第

四，任何政策的供给只有上升到国家层面，才具有理所当然的合法性。当然，由于政府自利性的存在，政策供给的长期垄断化又是新一轮政策需求的动因。

命题8：政策变迁的效益模型呈现抛物线或倒U型，非平衡运动是政策演进的主要特征。

政策变迁的效益一般呈现这样一个特征：在变迁初期，由于政策惯性的存在，政策变革的阻力很大，付出的成本也大，同时也要冒很大的风险——这也是一种可能性成本，政策效益不很明显；在变迁中期，由于政策资源到位、参与群体配合默契，摩擦成本降低，一旦突破瓶颈后便效益大增；在变迁后期，由于政策老化、疲劳、磨损，政策耗损特别大，政策效益逐渐降低，甚至趋向于零。在图5中，以纵轴表示政策效益V，以横轴表示运行时间T，我们可以看到政策变迁呈现倒U型轨迹。在这个过程当中，由于最初国家的强力动员和强制性执行，处于无政策状态转向有政策状态时，可能出现半抛物线模型（如图6）。中

华人民共和国成立时及其后续一段时间所颁布的政策基本上属于此类，人事

档案制度即是如此。人事档案制度从产生到投入一定时间成本的运行，效益均良好，但由于制度环境所发生重大改变（市场经济的实行等），政策效益的下滑也就不可避免。但大部分政策的变迁，如联产承包责任制、乡镇企业制度等，其政策绩效与边际效益都一般性地呈现抛物线或倒U型轨迹。

政策效益或政策绩效是由政策功能（政策产出）和政策成本（政策投入）的比所反映的，表述公式为V＝F／C。政策功能F的大小和政策成本C的多少都将决定政策效益的大小。其中，政策功能与政策效益成正比，政策成本与政策效益成反比。在早期、中期、晚期不同阶段时间段里，由于公众对政策展现出从认知、服从和内化的不同态度，由于政策功能和政策成本的区别性表现，因而政策变迁绩效也就呈现不同阶段的差异性，同时也反映了政策变迁运动（政策演进）的非平衡性。这种非平衡运动不但表现出时间运动的非平衡性，也表现出空间运动的非平衡性。从时间上来说，政策演进经历了动员→调适→内化的阶段；从空间上来说，政策演进一般经历了试点→推广→普及的过程；到最后，政策演进进入到了时间变迁上的老化和耗损、空间变迁上的衰减和退出状态，从而完成了一轮政策变迁的周期。比如，农村税费政策的演化就是一个典型性的经验支持。［20］

命题9：政策演进具有内在的阶段性和可能性边界，确定转折点是把握政策变迁进程的关键。

根据演进的政策工具状态，笔者将政策演进划分为政策学习、政策转轨和政策治理三个阶段。政策学习（policy learning）是“指那些相对持久的思想改变或者那些源自于经验或新信息，以及关注政策目标的实现或者修改的行为意图”［21］。郝勒特（M. Howlett）和拉米西（M. Ramesh）把政策学习区分为内生学习（endogenous learning）和外生学习（exogenous learning）两种类型。与内生学习相对应的是教训吸取（lesson-drawing），源于正式的政策过程，影响政策制定者对政策方法和政策工具的选择，主要是技术层面的改进；与外生学习相对应的则是社会学习（social learning），源于政策过程外部，影响政策制定者适应或改变社会的阻力或能力，是一种最为根本性的学习［22］。由此，政策学习是指内在要求与外在刺激形成的模仿和借鉴过程，也是政策获取经验和新知的阶段。政策转轨（policy transition）是指旧政策到新政策的更替过程，也是此政策均衡到彼政策均衡的中间状态。政策治理（policy governance）是指运用“完全状态”下的政策工具进行行政管理的阶段，是政策演进进入政策均衡状态的常规阶段。在这些阶段中，政策转轨是一个关键环节，它对政策学习和政策治理起着承上启下的作用，也是政策变迁进程的转折阶段。在由旧政策转向新政策的关键点上，演进的目标取向、内容设计、路径选择等显得至关重要。

同时，政策演进取决于政策需求与供给的内生变量和外生变量，政策演进都是在一定的制度环境和可控要素的框架内进行的。拉坦和Hayami强调了天赋资源、技术、制度和文化要素四个变量。诺斯分析了财产权、国家和意识形态三个基本要素。菲尼认为，有很多因素影响政治秩序提供新的制度安排的能力和意愿。这些因素包括制度设计的成本，现有的知识积累，实施新安排的预期成本，宪法秩序，现存制度安排，规范性行为准则，公众的一般看法，和居于支配地位的上层强有力决策集团的预期净利益。［23］从西方学者的分析中我们可以看出，任何一项政策演进都是在宪政制度、意识形态、知识信息、文化传统等制度环境的框架内进行的，它们构成了政策变迁的约束条件和可能性边界。因而，政策演进的目标、方向、速度、形式、广度、深度和时间路径取决于这些特定的约束条件和目标函数。脱离开政策演进的性质、目标、政治结构和宪政制度，就不可能准确地把握变迁的实质。中国的政策变革和社会转型就是在社会主义宪政制度和中国具体国情实际的基础上展开的，是从计划经济体制走向市场经济体制的渐进更替，是采取增量改革方式的制度演进。当然，政策演进过程中宪政制度的边际性调整也是可能的，比如建国以后的五次修宪。其实，许多政策的变革，比如户籍制度改革等，一方面它反映转型中国背景下具体的政策演进，同时也是宪政制度的边际性调整。

注释：

［1］格塔尔•托尔思维克：《时滞命题：经济和社会系统中的路径依赖》，载斯坦因•U•拉尔森主编《社会科学理论与方法》，上海人民出版社2002年版，第98页。

［2］L.Hurwicz,On informational decentralized systems,in Decision and Organization(Radner,R.and C.B.MC Guire,Eds),Volume in Honor of J.Marschak,North-Holland,1972,p.297~336.

［3］参见L•E•戴维斯、D•C•诺斯：《制度创新的理论：描述、类推与说明》，《财产权利与制度变迁——产权学派与新制度学派译文集》，上海三联书店、上海人民出版社1994年版，第317～320页。

［4］张维迎：《博弈论与信息经济学》，上海人民出版社1996年版，第3～4页。

［5］柯武刚、史漫飞：《制度经济学：社会秩序与公共政策》，商务印书馆2001年版，第349页。

［6］吕炜：《中国经济转轨实践的理论命题》，《中国社会科学》2003年第4期。

［7］张建伟：《“变法”模式与政治稳定性——中国经验及其法律经济学含义》，《中国社会科学》2003年第1期。

［8］亚里士多德：《政治学》，商务印书馆1965年版，第48页。

［9］哈丁设想古老的英国村庄有一片牧民可以自由放牧的公共用地，每个牧民直接利益的大小取决于其放牧的牲畜数量，一旦牧民的放牧数超过草地的承受能力，过度放牧就会导致草地逐渐耗尽，而牲畜因不能得到足够的食物就只能挤少量的奶，倘若更多的牲畜加入到拥挤的草地上，结果便是草地毁坏，牧民无法从放牧中得到更高的收益，这时便发生了“公用地悲剧”。参见Garrett Hardin.The Tragedy of the Commons.in

Science,Dec.,1968,Vol.168.1244.

［10］曼瑟尔•奥尔森：《集体行动的逻辑》，上海三联书店、上海人民出版社1995年版，第18页。

［11］详见陈潭：《集体行动的困境：理论阐释与实证分析——非合作博弈条件下的公共管理危机及其克服》，《中国软科学》2003年第9期。

［12］丹尼尔•W•布罗姆利：《经济利益与经济制度——公共政策的理论基础》，上海三联书店、上海人民出版社1996年版，第66页。

［13］谢识予：《经济博弈论》，复旦大学出版社1997年版，第128页。

［14］公共政策从总体上来看是一种利益关系调整，利益调整总是表现为零和博弈和非零和博弈两种状态。政策变迁总体上应该是非零和博弈，但在一定时期内零和博弈也是长期存在的。而从政策本身来看，新旧两种政策的博弈状态则是由非零和博弈转向为零和博弈。

［15］张维迎：《博弈论与信息经济学》，上海三联书店、上海人民出版社1997年版，第17页。

［16］“政策经济学”的概念和学科构想源于制度经济学的逻辑演绎，同时也获益于阅读西方已有的公共政策经济学著作，详见John C.Goodman and Edwin G.Dolan， Economics of Public Policy:The Micro View(3rd Edition).West Publishing Company,1985.

［17］王沪宁：《新政治功能：体制供给和秩序供给》，《上海社会科学院学术季刊》1994年第2期。

［18］戴维•菲尼：《制度安排的需求与供给》，V•奥斯特罗姆等编《制度分析与发展的反思——问题与抉择》，商务印书馆1992年版，第138页。

［19］所谓“诺斯悖论”即“国家的存在对于经济增长来说是必不可少的；但国家又是人为的经济衰退的根源”，说明的是国家权力在垄断租金最大化的驱使下导致国家陷入低效率状态的可能性。参见诺斯：《经济史上的结构和变革》，商务印书馆1992年版，第21页。

［20］详见苏向荣：《建国以来中国农村税费改革政策分析》，陈潭等著《公共政策案例分析：基于理论的与实证的视角》，湖南师范大学出版社2003年版，第192～222页。

［21］保罗•A•萨巴蒂尔：《政策过程理论》，生活•读书•新知三联书店2004年版，第161页。

［22］Michael Howlett and M. Ramesh, Studying Public Policy: Policy Cycles and Policy Subsystems. Oxford University Press, 1995, p. 175.

［23］V•奥斯特罗姆等：《制度分析与发展的反思——问题与抉择》，商务印书馆1992年版，第144页。

该文原载于《中国软科学》2004年第12期，《新华文摘》2004年第24期摘编

陈潭：公共政策变迁的理论命题及其阐释

小程序 | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏