政策的选择和落实是政府的根本职能,然而我们很难在政策真正得到实施之前了解它的效果与影响。因此,许多国家的政府都曾进行不同程度上的政策试点来降低未来政策的不确定性。本文分析了自20世纪80年代以来中国的系统性政策试点。在这期间,中国政府在决定是否将某些政策推广到全国之前,曾有选择地在一些局部地区尝试执行这些政策并评估其效果。

以下两个原因使中国的政策试点成为一个重要的研究对象。第一,中国的系统性政策试点无论在深度、广度和持续时间上都是其他国家无可比拟的。第二,学者们普遍认为,在过去40年里,系统性的政策试点是促进中国经济增长的关键机制。即便如此,令人惊讶的是,学界对这类政策试点的特征或结构、以及其可能如何影响政策选择和政策效果都知之甚少。

为评估政策试点是否为政策向全国推广提供了有效而准确的信息,作者关注了其以下两个特点。第一,由于同一项政策可能在不同地区产生不同的影响,在评估政策效果时,需要确保进行试点的地区能够准确代表其他没有进行试点的地区。第二,政策执行者(例如地方官员)的行为往往能影响政策的结果,因此,如果一项试点带来了政治激励,这可能会导致地方官员将更多精力和资源倾斜到这项试点当中,从而在试点阶段夸大了“实验效果”。

从这两个角度出发,作者收集了 1980 年至 2020 年期间中国政策试点的 19,812 份政府文件,并构建了由 98 个中央部委发起的 633 项政策实验的数据库。关于研究方法,作者在论文中有详细描述。简而言之,他们将包含政策指导意见的中央政府文件与所有相应的地方政府文件联系起来,从而可以追踪每项政策在全国的实施情况。他们衡量了政策试点的许多特征,包括事前对政策有效性的确信程度、涉及政策试点的中央和地方官员的职业轨迹、政策发起部门的层级结构、地方政府政策实施的差异程度、以及当地的社会经济条件等等。

通过分析这些数据,作者发现了以下结果:

  • 政策试点的“样本选择”不具有代表性:被选中参加政策试点的地区,相比于没有被选中参加试点的地区,往往具有更高的经济发展水平。这种“正向选择”在很大程度上来自于中央与地方政府之间所存在的激励不相容。
  • 政策试点过程中的“实验情境”不具有代表性:在试点过程中,地方官员为了获得试点成功从而博取政治资本,往往会有意识地将精力和资源向试点政策倾斜。这可能会导致该政策的有效性被夸大:当政策最终推广到全国时,其他地区的官员不会同样把精力和资源倾斜给该政策。
  • 中央政府在评估政策试点的结果时,没有完全考虑到上述不具有代表性的“样本选择”和“实验情境”,从而会导致对政策效果的评估以及相应的政策选择存在一定程度上的系统性偏差。

这项研究揭示了中国政府在政策试点中所面临的一个制度设计问题:如果构建政治激励机制,以鼓励政府官员努力执行国家政策,但同时又确保这些激励机制不会在试点阶段影响样本选择和实验情境,从而降低政策试点结果的偏差?从机制设计的角度解答这一问题,将有助于政府开展更加科学的政策试点,并进而做出更为有效的政策选择。