ParK's 論文后花園-多人博弈中的策略选择与协调

华中科技大学
博士学位论文
多人博弈中的策略选择与协调
姓名：蒋天文
申请学位级别：博士
专业：西方经济学
指导教师：方齐云
2003.5.8
华中科技大学博士学位论文
摘要
f 自上世纪50年代以来，合作博弈就已经吸引了一大批学者的兴趣。这导致了
后来政治学科、经济博弈论的飞速发展，其中最为引人注目的是在政治投票、公司
股权设计、公共和私人产品定价及群体协调问题方面的理论和工具创新。然而在70
年代后期，随着博弈论转入非合作博弈研究以后，合作博弈理论渐渐融入了新的学
科之中，主体就不再突出。
作者发现，合作博弈在三个方面值得开拓，以便使该理论能够应用到传统领域
以外。首先，小到伙伴、小团体和家庭关系，大到区域、国家、国际和自然系统都
出现了高度自组织现象，而这种自组织就是一种合作形态。因此，它可以用来解释
现实中的企业、政府、区域等诸多经济现象。其次，群体合作总是面临结构化问
题。当涉及到制度、组织和结构化问题时，利用网络理论来进行展开分析将非常有
意义。三是协调问题。我们由于共同遵循协调人推荐的行动方案，从而避免了昂贵
的或者根本不可能的沟通、通讯过程，减少了交易费用和磨擦冲突，使世界处于和
谐之中。如果这些协调人突然出现了异常策略将会出现什么后果?协调人必须具有
什么样特征?正是对这些问题的好奇和思考促使作者选择了这一有意义的问题作为
论文的主题。)r——)一
本文第一部分介绍了大群体博弈的起源及理论探索过程。诸如Banzhaf值、
Shapley．Shubic值、核心、oven值及Myerson值都是一些有意义的理论概念，它们
分别适应于不同环境下的博弈均衡解的预测。第二部分包括第2至第9章。该部分
除扩展了现有理论的应用以外，也吸收了该理论在其它交叉学科发展过程中的类似
案例。例如，公司股权优化问题是取自最近发生在武汉的一个公司合并案例，其理
论基础直接来自于政治投票模型。税收及医疗系统的合谋研究本身是合作博弈的运
用。区域经济中的策略选择问题是作者对合作搏弈的一个重要扩充。在本文中，作
者尝试性地把“区域”概念理性化，从而把一个总体问题转化为适合标准博弈论方
法来进行探讨。
／用网络描述合作博弈的最早文献来自于迈耶森(Myerson)，它试图通过图来
扩展人们之间的联系过程。网络中的节点代表参与人，节点间的联线代表双方经
济、社会关系。如果双方是通过合同联结的，结果将是一个委托代理网络：如果是
通过交易来连接的，它将是一个交易网络。本文中医疗产业合谋，是一个网络内部
华中科技大学博士学位论文
的联结模型，而国有企业中产权链是另一个委托代理网络模型。从模型的解结构
中，我们发现，网络中参与人的道德风险选择空间会迅速上升。这使过去企业理论
中的许多问题可以在此模型下得到较为合理的解释，且方法异常的简单。例如，内
部人控制、路径依赖、机构膨胀等，都来自于网络的结构特征，它是广泛的道德风
险来源。
合作网络可以看作是多人联盟形态。当我们把网络中的所有参与人都看作是一
个人时，此时我们并未考虑结构效率、代理风险、交易成本等问题。这种网络被作
者定义为虚拟网络，例如“武汉市政府”、“安然公司”等都是一个虚拟网络，它
不过是一个标签。但当我们考虑这些“信息包”的结构时，一个虚拟网络就能够按
照某种规则进行展开，使我们看清它的结构。“信息包”式的虚拟网络具有重大理
论与现实意义，因为它具有更高的信息传播效率、节省搜寻费用等，因而是市场的
进化形态。但是，它的缺点也是显而易见的，因为“信息包”内的策略选择空间过
大，容易导致道德风险发生。该模型应用了遗传算法原理来模仿群体行为优化过
程；卜<一一
文中最后一部分探讨了协调人问题。其结论是，当群体不存在协调时，它是一
个非合作博弈。f然而，长期的互动过程将会出现协调行动。每～个联盟都有一个协
调人，最终又会融入更大的参照系(协调入)。模仿自然选择过程，本文利用理论
模型和案例证明了这一理性的形成过程，也证明了探索这一过程的艰难性。随即出
现的问题是，在我们这个多变的世界中，政府、自然环境、文化、家庭等都处于动
态变化过程中，如果他们出现了异常策略，将导致与之相对应的群体突然陷入混乱
之中·．>一厂一
关键词：多人博弈合谋网络协调博弈
Ⅱ
Abstract
Since 20”century 50s，as an important theory for analyzing cooperative behavior
between groupS，cooperative game has attracted a great deal of attention of scholars，
resulting in the rapid development of politics and economic game．The most striking trend
is that the cooperative game is applied in political voting，firm share-design，the pricing of
public and private products and group coordination witll enormous innovation in both
theory and tools．However,witll the non·cooperative game theory emphasized in the end
of 70s，cooperative game gradually fused into the new subjects and slowed its pace．
The author finds out that the cooperative game theory can be extended in thlce
directions：111e first one is that cooperative game Can explain many∞tual phenomena
诵min companies，governments and regions，where highly self-organizing is comnlon and
such self-organizing is precisely a form of cooperation with great significance．But
cooperative game fails to give more explanation within its framwork．The second is the
structural problem in the process of cooperation．The author uses network theory to
examine the relationship of n-person cooperation in terms of institution，organization and
structure．111e third is coordination．We follow the action programs given by coordinators
of various levels and avoid the expensive and impossible communication，reducing the
transaction cost and friction to make the world a harmony one．The problem is what if the
coordinators present unusual strategies and what characteristics the coordinators should
have?That’S the reason why author selects such problem as the theme ofhis dissertation．
This paper consists ofthree correlating parts，each part analyzing one problem and sharing
a common theoretic base．
The first part introduces the origin and theoretic exploration of big group game and
rational choice．Some concepts，such as Banzhaf,Shapley-Shubic value，oven value and
Myerson value provide solutions to game equilibrium under different circumstances．
The second part includes chapters from 2 to 9．In this part．author discusses some cases
of the theory applying in other interdisciplinary subjects，in addition to the extending of
current applications of theory．For example，firm share optimization in a case of company
merger in Wuhan shows that as a weighting voting system，co．orate governance structure
shares common process with political voting．The collusions in taxation system and
medical care system are the application of cooperative game．When collusion objectives
conform to formal organization objectives，we calI them cooperative behavior,otherwise，
collusions．Also，we complement the cooperative game with the strategy selection in
regional economy．
111
Myerson is the first one to use network to describe cooperative game，trying to extend
the economic correlation between people by means of graphic theory．In the cooperation
network，node stands for participant．the line stands for the possible link of economy or
social．If two parties are related by contracL that will be a principle-agent network．We
find out that the room for participants’moral hazard increases rapidly，and such finding
provides explanation for insider-contr01．route-dependence and agency swelling．111e
author pmdentiy takes such finding as his innovation．
Cooperative network Can be thought as a form of n-person aliiance．When all
pattieipants of the network are taken as one person．we usually pay no attention to
structure efficiency．agent loss and transaction cost．11lis kind of network is defined as
virtual network，such as“Wuhan municipal govemment'’，‘‘Haler group'’and‘‘Anron
Company'’．Correspondingly，when considering the structure of such‘‘information pack'’，
we define them as organizational network,transaction network or agent network．So，a
virtual network Can be unfolded in certain way and presents its slructure．n坞virtual
network of“information pack'’has great theoretic and practical significance in that it has
better communicati∞efficiency and saves searching cost．It also has obvious shortcoming．
the space ofstrategy selection of‘‘information pack'’is too large to be subject to the moral
hazard．
The third part discusses the coordinators in group cooperation．The conclusion iS that
it is a non·cooperative game when there is no coordination in group．In fact，the long
interaction keeps the grouD in diverse levels of coordination．Each coordinator Can make
an alliance act in one way and at last melt into a larger reference system(coordinator)，
such as family,culture．country and natural ecological system．The author testifies lhe
formation ofrationality through imitating the natural selection．11地subsⅨluant problem is．
in this changing world，governmenL natural environrnenK culture and family all in
dynamic process，ifthey present unusual strategy，the according group will be thrown into
chaos．
nle author also makes some c铀e study,such勰revealing the cooperation and
coordination in nature through plant pollination process；demonstrating the conform of
culture and governmental policies by means of social cooperation and the cooperation
bankruptcy resulting from coordinators’unstablity．But there is still much work to be
done．what the author has done is just a prelude to further research．
Key words：N-person Game Collusion Network Coordination
lV
华中科技大学博士学位．论文
1导论
1．1问题产生背景疑理论回顾
多人互动是我们这个社会的总体特征。虽然入们的行为动梳仍然是基予个久理
径的，置趸自我选择静，健在大多数豹德况下，合作困其毒缀好懿福利性矮，人们
总是选择不嗣豹会终水平进行念作。上世纪80年代以来，经济学认为非仑作博弈
是合你的基础，而合作是～种进化形态并且怒实现个人理性的重要工其之一，从而
使研究潮流偏向了非合作博弈方面。然而，艇现象学上看，尽管经济芙系、柱会关
系中酶冲突诧怒彼茯，凸瑗出了谗弈健鼷懿～嚣：但默整钵上番我嬲仍然炭活在一
个档对和谴熬环壤中。合作仍然是囊然生态、国璐关系到日常经济生活中的一个普
遍现实。合作博弈不仅应该继续受到关注和研究，而且已经积累的智慧仍将启发我
们去认识群体互动性质的方方面面。
1．1．1从非合作到合作的过程
博弈中的参与人从个人利益角度出发选择互动方式，是入际冲突的重嫠根源。
憾是，基予博弈基确之．I-的个入选择是如俺走商会俸的褥?嚣蘸理论赛己缀提滋了
多嵇分袄瓣瑟静方法，其中最强著名熬蠢避纯臻究法、通讯褥弈、带合同博弈、协
调磷夯、学习与引导熄弈等方法。
进化研究法从博弈时间的长短、遗传和变异能力、“自然选择”逛力角度来认
识合作的进化线索。他们认为，祆长期来说，入稍会潮兔关注长耀l|芟益蔼敖弃鸳叛
行为。因魏，亵短期来说，我们可以容怨裴理性行为，但从长期来说，参与人不会
持续犯错误。除了熏复媳弈(oven，1982)【I】所涉及到的相关理论外，沿着这一思路
的还有阿尔钦(Alchian，1950)12j，Herslaleifer,I(1977)p／，梅纳德．史密斯(Maynard
Smith，1974，1978)阵”、缡尔森(Nelson and winter t982)辫，鞍艾宠囊诺德
(Axelord，＆R，1981，1984)【邵l等。致嬲分别从产业进化、经滋仿生、政治及社会
互动角度模拟了这一搏弈关系的诸多特征。
通讯、合同及协调博弈都涉及到信息沟通问题而其有许多藏同特征。在一个互
动的群体中，借助于通讯过稷、相互谈判、协调筷至含目采探索菱好支秸策礁，是
参与久之精避免貉入“瓣徒爨壤”豹重要方式。在Aumann(1976)19],Forges(1986)”Ⅷ
和Myerson(1991)等文献中，我们可以发现这方面技详绷的讨论+从中可以羲如，
只蘩奁胃行城内宥觅好躺支付解，策略探索是会发生的。
群钵行为之瓣县煮努郝往，爨褥会掰鬓行务静繁珞憨。这导致菜转穗瓣策略的
学习秘弓l导过程。在塔学彬(1999)编著戆《藩雾学习理论》中较集孛缝奔缓了襁
关文献ll“。博弈中的引导和学习过程在企业竞争、壮会含作翡掌踅要，它的动力攀
税懿青筋予我霄j疆解多样他的现实。
1．1．2 N入博弈的谶多特征
N入博弈的核心集中猩特征函数毅台作博弈上。作为一个多人博弈来说，最弓l
大液嚣熬是窀哥虢与菲合乎#薄弈共存。筑讨价颡价涵毅土看，当参与条件不褥得到
满足醛，台撵蕴袋，各方浚雅戮“嚣捷爨境”土；当蘼骞盼入采取一致行动辩，簿
雾转化为决饿关系，此时，一个n人参与人的撼弈关系中的N令个人可以篱继为一
个参与者；处于中间阶段的备种联盟竞争状态，我们既可以理解为不同屡次的合作
霹纛，毽可戳理解为不嗣群体之褥豹竞争荚系。这觚辅仔(1950，1953)和
Kalai(t977)静t孪徐还输鳃孛弼缓漪楚的看爨。扶这个凫凌上说，鞫翦鼷麓静键价述
馀送数都存在阀遂。一个合理的谶数墩该憝鬻譬代弹性避数，侄这样转换基楚否满
足纳什的五个公理还不清楚。
其次，禽幸#褥奔毽论为特征爵数黧博弈提供了多种解概念。如冯．诺伊曼一摩搬
嫠毽程瓣(Von Neumann-Morgenstem,1944)l臻，涉蛰秘缀(Shapley,1953)㈣、谈
判嶷(Aumann-Maschler,1964)114l按(schraeider,1969)㈣和逑尔森谯
(Myerson，1978){l棚等。此外，针对各种具体威用学科的特殊情况，还出现了许多
释解概念。魏Oven(t982)／媛甭予大群体博弈解，交形的ShapIey-schubic(1953)值和
Ba斌竣1972滤蚤|j广泛使惩予致浚爱投聚辏裂孛。
在逃行多人蒜赛分析黩，参与人并不一定鼹限予“入”这一擐念。只要爨存在
理性和个人策略选择的任何冲突局势，我们都可以把它理性化为一个参与人。例
翅，当我们把欢府藿俸是一个参岛入时，我们必须辩弃一个政府内部存在的复杂关
系，蓠先将之鬻谨霆一个理健夭；当觳丈囊然器终或避讫著露是一个对策露，麝鸯
的动檀物、气候霞子_秘人郝是对策孛的参鸟人，在这一愚黪下，本文在露瑶攫开了
较为详细的论述。
1．1。3鄹终状怒与套{乍蜷弈的等徐性
网终是圈论中的重要内容。玄因为直溉、自成理论旦能与矩阵相互转化两褥烈
广泛应用。在研究合作博弈时，我们教现参与入、关系、联盟、均衡解簿概念经斑
华中科技大学博士学位论文
适当的定义后，基本可以与网络图论共享理论基础。除了节点代表各个参与人外，
网络的联通关系数就等同于联盟数。网络中的联结关系可以是通讯、物理设备、食
物能源关系、社会交往、合同等，网络流量可以是信息流、能量流、成本收益等变
量；在纳什网中，网络往往是空的(非合作解)、满的(联盟状态)；网络内部的
讨价还价事实上是网络竞争、树竞争和个人竞争的总体。
1．1．4显示原理与协调人的作用
显示原理(Myerson，1986)断言，一个隐藏信息的博弈往往能够转化成一个直
接的显示博弈【l”。这是任何建立在自我选择和分散执行基础上的群体行为都能够协
调行动，避免昂贵沟通的重要基础。只要我们按协调人推荐的策略行动，每个人都
将能够获得更好的支付，并且没有人能够通过背叛来改善自己的状况。在协调博弈
中，最早的博弈理论是建立在二人博弈中的合作问题基础之上的。但是，从本文
看，协调人确实可以保持在不同的层次上，从自然界到国家、文化传统等各个尺度
都在协调着相应的群体行为。这方面的部分文献可从库伯(kuber，1986)[18】等协调
博弈模型中找到较详细论证，它模拟了在互补系统中的合作与协调可能性。尤其有
意义的是，它强调了政府的协调作用。此外还有大量文化协调的文献
(Myerson．1992)。
1．2本文问题的由来
作为一个完整理论体系，多人博弈理论已经为我们提供了许多非常有用的分析
问题工具。但是一些重要问题仍然存在。这主要表现在以下几个方面：
1)参与人的定义问题
从理论上的参与人到具体的参与人定义问题。多人博弈作为分析处理群体冲突
的理论，应用前景非常广泛，但是这个转化过程是艰难的。因为博弈论要求把任何
一个复杂的现实问题转化为适合于标准多人搏弈问题的分析工具，目前该理论的方
法仍然不是很充分。例如，国家、企业、政府及各种社会网络都是一个集合概念，
它是由分散群体合成的抽象参与人。相应地我们也可以把一个整体集合概念分解为
多个参与人。我们能否把r1人博弈理论创造性地运用于这些领域的分析?虽然在公
共决策、企业公平定价和社会选择领域的应用比较成熟，但在上面这些问题中的运
用并不多见。
2)合作的成本问题
n人博弈提出的问题与未解决的问题～样多。通常的作法是，在处理多人博弈
论问题时，一般总是假设某些条件是给定的。但在现实中，这些条件很值得我们注
意。例如，一个协调人的出现虽然有助于合作，但在大群体中协调人是如何被发现
并获得一致认同的?如果协调人出现策略不一致时将会出现什么后果?这个问题非
常严重。例如，一个政府内部的全部参与人可以看作是n人合作关系时，我们事实
上是在零成本下讨论这一问题的。但是，一个政府组织的重建、合作维护往往需要
巨大的成本支出。但在一般经济学文献中，政府确实是虚拟为一个参与人的。在本
文中，作者打算考虑这一问题，并试图回答在什么情况下我们可以把政府当作一个
整体，什么情况下又必须离散化。前者作者将之定义为虚拟形式，后者称之为代理
政府。
3)群体结构化问题
群体中的个体参与人总是隶属于某一特定社会结构之中，这就出现了网络问
题。在合作博弈的均衡解中，我们往往假设参与人之间能够完全得到沟通，这不仅
不经济、不现实，某些情况下则是不可能的。例如植物不能与阳光沟通，我们不能
轻易的与布什总统沟通，处于四川的一个产品出品商的产品虽然被纽约的某一消费
者消费，但他却不容易与消费者直接通讯。事实上我们是通过一个复杂的代理或交
易网络来处理这一问题的。交易的网络性扩展是现代经济的主要特征，通过网络成
长过程，全球视野都可以纳入一个分工协作的合作网络中。当我们把参与人看作是
一个结点时，许多联盟可以被排除，结果剩下一个清晰简单的结构。
4)合作中的协调人
群体之间需要协调才能走向合作和和谐。一个大群体可以通过不同特征来合
成，这需要很多不同的协调尺度。从家庭、伙伴、小集团、区域、国家、地区或国
家联盟到国际层面是一个重要的合成途径。自然生态系统的和谐也必须参照某些共
同准则。然而，正如合作博弈中的联盟理论所揭示的，当协调人突然消失、协调人
出现异常策略时，一个大联盟会迅速分解为许多子联盟。虽然若许时期后，新协调
人会重新出现，但由此花费的时间成本、可能引起的冲突等将是惊人的。显然，目
前的合作理论对此并未给予关注。
1．3论文的结构及主要内容
在第1章的导论中，作者首先提出了群体博弈中的联盟问题及合作的形成机
制。该问题是建立在对合作博弈理论的广泛回顾基础之上的。合作博弈的理论基础
大约在上世纪50年代末期开始奠基，70年代已渐趋成熟。70年代后期，尽管博弈
4
论转入了非合作博弈，并还原到经济学最基础性问题，合作博弈仍然在丰富自己理
论领域的同时，开拓自己的应用领域。其中，应用得最多也是最成熟的领域有：合
作中成本的公平分摊，它目前是指导环境治理、公共工程及企业定价的重要方法之
一；社会选择领域，它以加权投票对策为代表，广泛应用于政府决策、选举和公司
股权结构设计等过程。仅此就足以见证该理论的特殊魅力。
纳什网(NashNetwork)从博弈的空间关联形式及均衡解给出了一个更加迷人
的合作博弈前景。迈耶森(1979)从网络角度定义了参与人的相互关系，这使各种
经济、人际交往都能够通过网络给出定义。而我们则可以轻易的利用该方法来重构
现实中的各种关系，如委托一代理网络、交易网络、社会交往网络等，其灵活性完
全依赖于自己所研究问题的需要。网络是图论的重要内容，它既可以形象地模拟现
实，又可以通过矩阵来等价表示，从而方便地利用矩阵论的方法对大量参与人、复
杂联结关系的博弈问题进行分析。
鉴于此，本文第一章的重点是：除了回顾多人合作博弈的理论以外，有选择性
地对本文将要涉及到的诸多概念进行了详细论述。以后章节中对该理论和应用的扩
展都将严格限制在本章所作的假定之下。而对所谓带边支付、可转换效用、不完全
信息等并未给予过多关注，原因是本文更偏重于制度分析，引入的理论已经足够
了。
本文结构中的第2章至第5章都是合作博弈理论的典型应用问题。然而，在作
者看来，博弈论既是理论又是工具。我在分析问题时，主要还是把它作为一个重要
分析工具来看待的。压缩在这一部分中的内容既可单独成章，又可以看作是合作博
弈的应用分支。每一部分都以合作博弈理论为基础，同时又与相应的专业学科相联
结，跨度极大。
文中的公司股权结构问题分析是一个典型案例式的，它分析的是发生在武汉地
区的航空公司合并案例。从引文文献中可以看到，本文这一部分几乎无任何创新，
在原文献中可以找到完全相同的分析案例。之所以引入这一案例，原因是目前国内
学者在研究股权结构中并未了解这一经典工具，但却已经发现了股票比例与控制力
不一致问题。据我推断，这一模型由于直接来源于西方政治模型，而这些模型在我
国从来不大容易引起注意。不过，经过作者对该案例的分析和诠释，一个简单的问
题突然变得生动有趣了。
税收系统中的合谋是为分析征纳双方博弈关系问题定做的。就目前我所了解的
关于税收方面的文献来看，有很多学者都对博弈论在税收系统中的运用感兴趣a但
从文章思路上看，都与张维迎(1997)《博弈论与信息经济学》中引用的监督博弈
大同小异。为了了解问题的复杂性质，本文引入了多人博弈过程，以便把更多的参
与人纳入税收问题的分析框架。对这一问题，作者认为思路比较开阔，但分析仍然
是肤浅的。但我本人却得到了丰厚回报，因为它促使我思考如何把分散的群体合成
为一个整体，又从联盟的稳定性角度出发发现了这种简单合成的危险性。它是协调
人不稳定带来的后果这一思想的来源。
《区域经济的囚徒困境及其瓦解机制》是本文独自开创的合作博弈在区域经济
中的运用。在那里，区域被理性化为众多参与人合成的一个整体。该部分利用动力
方程来建立区域互动关系，其均衡解作为选择不同策略的报偿列于报偿矩阵中。然
后，分别分析了整体(区域)执行、分散执行和集团执行情况下的纳什均衡解。其
结论非常有趣；如果区域是整体执行的，那么区域经济将具有自给自足的趋势；如
果完全分散执行，区域经济将是角点解；而现代经济典型特征则是集团(联盟)执
行的，因此它将稳定在专业化分工的比较竞争优势之上。至于如何瓦解区域囚徒困
境，不过是对一系列参数的调节问题。
第6章中的医疗系统合谋问题是合作博弈在产业博弈中运用的一次尝试。在医
药、医院、医生、病人和医疗保险各方的相互关系中，长期的合谋操纵问题严重损
害了人们的建康水平、提高了医疗成本并腐蚀医疗系统的道德观念。许多学者试图
从不同角度揭示这种扭曲的机制，但仍然存在诸多不足。对这一问题的分析，本文
是通过对多种经济分析理论进行筛选后，最后认为以合作博弈为主线较为合适。通
过这一主线可以发现，我们的医院和医生最终都成为医药公司的雇员了。如果还原
到问题的根源并进行治理的话，一个现代公司式的股权结构、治理结构和社会监管
结构必须同时引入到医疗系统中来。否则，这种机制对经济、健康和道德的伤害将
会持续下去。
第7章论述了多人博弈中的一种普遍进化形态：信息包搜寻问题。任何企业、
产品生产都涉及到大量的参与人。当我们从虚拟形态看待这些企业或产品时，它可
以简化为一个参与人。例如，中国海尔集团、美国安然公司等企业法人是一个参与
人。同时，我们也可以把它们看作是经济网络中的一个子网，此时它由大量的交易
者构成。这种包含复杂参与人和复杂交易过程的技术，本文定义为信息包交易。从
现象学上看，现代市场经济大多是企业和产品等形式的互动，而不是所有参与之间
的互动。为什么市场向这个方向进化?它是有效的吗?除了科斯《企业的性质》所
说的原因外，本文从搜寻角度回答了这一问题。这一章利用了最新优化技术一基因
算法(genetic．algorithm)原理来定义企业的多样性，利用市场选择(等同于生物中
自然选择)模拟了企业的生存性能。结论是，消费与生产都是一个多人参与人复杂
6
决策过程，如果让消费者随机搜寻，不仅是不可能的也是不经济的。但让专业化企
业负责搜寻，就会减少大量的交易过程。但是，也有风险。因为消费者的搜寻不是
遍历的，企业可能出现道德风险且会沿着交易网积累而不能淘汰劣等产品。显然，
安然公司是一个典型案例，而我国存在的假信号更是这方面的例证。
第8章中的《委托代理网络及道德风险》问题是该文最重要的一章。在众多的
委托代理问题中，委托代理网络化可能更接近现实。本文通过代理制把一个复杂的
博弈问题转化为委托一代理网络，因此它是合作博弈的直接延伸。与已有的委托代
理问题相比，该方法能够处理更现实、更复杂的多人博弈关系，而且分析方法异常
简单。目前大量的委托代理文献中使用的理论不仅超出了一般学习者接受范围，甚
至超出了一些专业人员的知识范围。但本文却用相对简单的方法得出了相似的结
论。同时，一个被定义了的网络事实上可以作为一个社会、组织的虚拟形式，节点
(参与人)理性选择过程正是许多组织问题所具有的特征，如机构膨胀问题、在职
消费问题、内部人控制问题、腐败等，它们是道德风险的更广泛的存在形式。
当多人关系被网络化后，我们发现，处于一个网络中的代理人的策略空间会迅
速扩展到多个维度，这为道德风险留下了更多空间。一个典型的现象是，当个人的
支付远远低于他的保留支付时，他应该放弃参与。但是我国的公务员、部分企业领
导及许多在位者的工资收入长期偏低，他们为什么不选择放弃参与?是他们不能寻
找到更高工资的职业吗?是他们在网络中的相对地位给予了额外报偿，还是他们能
够因道德风险原因进行某种权衡?从现有报道和本人职业经历可以看出，在网络中
的地位本身具有经济价值。还有另外一个证据是：国有企业员工下岗和私人企业员
工的解雇不是一回事，处于不同部位的雇员被解雇时，也不在同一个补偿水平上。
这再一次证明了处于网络不同部位、节点状态参与人势力不对称问题。
第9章《谣言的预警功能》是这样一个故事：世界上的网络结大体上可分为三
类，随机均匀网络、小世界网络和局部网络。网络内部节点联接密度和平均距离决
定了通讯效率。最高效率的网络是是小世界网络，它是自然、社会经济优选出的一
种稳定互动结构。在小世界网络中，它同时具备局部网络的节点密集性和随机均匀
网络的最短距离特征，从而造成了小世界现象。这种现象对启动经济增长、传递外
部随机冲击、信息及传染病扩散方面都非常有效。从文献上看，许多学科分别分析
过不同的网络：犯罪网络、计算机病毒传染网络、昆虫联系网络、电力网络、经济
联系网络、谣言形成等。但本文关注的是：当多种网络共存、重叠时，网络传播动
力学问题。一个有趣的结论是，当社会交际网络、传染病网络和政府干预网络重叠
时，谣言会扩大初始冲击，形成第一个高峰。它的功能相当于一个放大装置，弥补
7
华中科技大学博士学位．论文
了传统传染病预防医学在小世界网络中的无效性。谣言具有双重功能，一是它会引
起恐慌，从而警醒易感人群采取自我防御；二是强迫政府提前介入。中国非典型肺
炎的传播、谣言传播和政府理性干预印证了这一过程。
合作是需要条件的且是昂贵的，它需要精心的运作和经常维护。合作在现实中
一直困惑人们的是，它对社会带来的好处与伤害一样多。本文第lO章主要论述了
协调在大分散群体中的作用。
合作可以在不同的层次上进行，从而合成为不同规模的群体行为过程。本文认
为，一个由众多分散参与人构成的“生态系统”之所以能保持动态平衡和和谐共
存，不能仅仅依靠各方的相互沟通过程来完成，因为它面临着成本、信息和技术上
的障碍。他们一定是共同参照某些背景交量，然后按规则“出牌”来达到的。或者
说，存在一些认同的背景(协调人)，每个人都与协调人签订一个合同，按它推荐
的方案行动。按照这个思路，本文认为，在协调自然、社会系统中，几个有代表性
的协调人是关键的，它们分别是自然信号、政府、文化等。不幸的是，目前我们的
文化传统正在消失，环境变量也交得难以捉摸，政府也会出现策略不一致问题，其
结果会导致所有参照这些协调尺度的合作系统陷入混乱。因为按照合作博弈理论，
当协调失灵后，联盟数量会迅速上升，群体陷入困境。虽然生态系统、社会系统都
有很强的学习能力和适应能力，但当协调尺度异常无规则时，我们赶不上这一变化
节奏。这最终会导致社会过份多样化来进行风险防范、平均使用资源，而不能获得
最大的报偿。
协调人的寻找过程及协调人策略不稳定对合作联盟的影响过程，本文提供了几
个有代表性的案例。一个是关于自然环境恶化引起的气候因子异常波动对植物的影
响，一个是文化传统消失对消费潜力的影响。此外政府政策的随机化可能导致社会
预期混乱，难以进行均衡的供应链管理问题，它是经济学长期关注的焦点。遗憾的
是，我发现了它，但我无能力去详细论述它。因此文章显得不够丰满，意犹未尽。
104研究方法及创新
本文研究方法中引用了较多的数理经济描述，但着重于特殊案例研究。文章的
主线是合作博弈理论及其分析工具，因此所有研究方法。包括网络理论、动力方
程、基因算法、集合论等，都是为了把～个具体的问题转化为适合合作博弈的分析
框架。本文的薄弱之处是没有作经济计量方面的实证检验。从文中看，区域经济这
一案例是完全可以结合实证分析进行的，因为参数检验所需的信息收集问题，完全
可以利用目前的区域统计资料。
华中科技大学博士学位．论文
一个平凡的n人相互作用问题可能会演化为复杂的对策局势。我们既看到了人
类总体上共处于一个和谐的、波澜不惊的环境，但局部的不均衡和“讨价还价”过
程也是此起彼伏：民族冲突、制度竞争等。当然，经济冲突始终是各种冲突的核
心，这在本文中反映的最为突出。是否存在一个更好的理论能够更加令人信服的去
解释这一现象，不得而知。然而，本文利用合作博弈的现有成果，从许多侧面去解
释了群体行为的多样化问题，并且扩展了经济学的视野。本文中的有些理论和案例
是在原来成熟的多人博弈理论框架下经过改造得来的。有的案例与理论是在原有理
论下的直接延伸；有些则是与其它学科的交叉中得来的：还有部分理论则是在该理
论启发下创造出来的。
1)逻辑模型
本文的理论部分是多人博弈中的合作行为与联盟之间的讨价还价过程。无论是
案例分析还是其它理论分析，最终都要将它们转化为适合多人博弈的分析方法。在
该模型中，值得注意的几个问题是：(1)如何定义参与人问题。本文在区域经济和医
疗联盟中做出了有意义的探讨，在那里，区域、国家、医院都可以在适当假定下得
到定义并理性化；(2)博弈关系的建立。文中主要是利用网络来结构化大群体之间的
关系的，这一方法不仅在理论上是可行的，应用前景也非常广泛：(3)策略均衡。策
略具有灵活性，主要看问题是什么。而均衡则完全依赖于合作博弈的均衡解。但只
要定义清楚了参与人及其互动网络，问题便迎刃而解。本文的税收博弈、医疗合谋
中就用过多种解概念。
2)网络博弈模型
网络模型是研究合作博弈的重要工具之一。自从1979年Myerson开始利用网
络建模一来，围绕着不同建网规则的文献很多。但是所有这些文献都遵守某些莛同
规则：网络中的节点代表参与人，联线代表着相互关系。这样就能够把一个分散的
大群体结构化为一个具体的网络。本文在利用这些成果基础上，特别关注了委托代
理关系的网络化过程并利用图论知识研究了两个典型案例，一个是带有环结构的医
疗产业合谋问题；二是作为树结构的企业组织内部的策略选择问题。另外，作者还
重点探讨了通过交易关系产生的网络联接问题。这种网络突出地反映出了一个重大
经济进化论线索：企业、产品形态的交易具有很好的信息传递、消费者甄别性质。
这种分析方法可能有助于了解一个具有长链、网络特征的复杂委托代理问题，从而
使委托代理超出了现有文献的分析范围。尤其重要的是，它可以用来分析一个结构
化的多人博弈关系，如产业链、企业、组织等。当我们把网络重新定义时，它又可
9
以回答许多相关问题，例如参与人是通过交易而不是合同联结时，它是一个交易网
络，同时它还可以是通讯网络、输送网络等。
3)动力方程
动力方程在《区域经济中的囚徒困境及瓦解机制》中得到了运用。在大量经济
问题中，一个大的且是分散的群体必须通过某种途径进行简化，从而合成为一些可
以得到很好定义的参与人。例如一个国家、社团、政府、种群、区域等。这就使参
与人能够合并、简化并适合抽象模型分析。这些参与人之间明显具有竞争动力学特
征。文中考虑了区域之间的竞争关系、均衡性质及联盟博弈问题。当我们把参与人
定义为国家时，该模型可扩展为国家博弈模型；定义为企业时它是一个企业或企业
集团模型。本文利用动力模型得出了不同策略下的区域预期支付矩阵，然后利用非
合作、合作博弈中的理性选择，得出了一些有趣的结论。这些结论在过去区域经济
文献中也有大量论述，但主要是作为现象提出的。而该文中则论述了这些问题出现
的根源、条件和瓦解机制。
4)学科交叉与经济仿生学
本文中利用了大量的交叉学科知识。公司股权结构问题直接来源于政治模
型，它在目前已经是一个比较成熟的理论；协调博奔中利用了大量的生态模型，其
中还有带马尔科夫过程的；网络最小联盟预测利用了大量可靠性理论与图论知识。
本文在选择交叉时并不是刻意使论文背景复杂化。每个模型都是经过精心筛选的，
其标准是：(1)闯题的性质非常接近于多人博弈关系；(2)两种学科之间必须能够共享
理论基础：(3)在其它学科里的应用比较成熟。
在文章中，比较令人陌生的是小世界网络和基因算法。由于小世界网络的正
式文献出现在1998年后，且主要集中在自然科学领域，因此作者冒险引入了这一
理论。但通过对大量文献的解读和涉及相关问题的理解，我本人认为不算过份。因
为它确实与现实符合；
基因算法(或遗传算法)目前在管理学科、工程学科中是用得较多的一种仿
生优化技术。这种算法首先从变异角度考虑生物的平等进化，然后利用“丛林法
则”进行优化，最后从种群的角度来判断生态后果。显然，个体理性是经济学的基
石，社会理性是遗传算法的目标。
但是，本文存在的问题是显而易见的。首先，文章中涉及到的学科背景和问题
都比较复杂，对于所作的结论本人并没有十分把握；其次。实证检验是缺乏的。区
域经济本来是可以作实证检验的但并没有作。
10
2相关理论回顾
N人博弈问题包括非合作博弈与不同水平的合作问题的综合【’91。合作问题最
重要特征在于N人中的不同层次结盟过程和讨价还价所确定的均衡解问题‘201。一般
来说，与非合作博弈问题相比，合作博弈由于扩展了参与人的策略选择空阿，从而
使均衡解变得更加不确定【2”。自上世纪70年代后期，博弈理论转入不确定性环境
下的非合作博弈，并且从理论和实验角度证明了合作的基础是通过讨价还价过程而
演进的一种博弈制度进化现象。然而，由于给定博弈环境下纳什均衡解的福利性质
(可能导致囚徒困境)，我们面临两个重要问题需要解决：一是基于个人理性下的
选择、探索过程，各种合作结构是一个普遍现实，其分析框架可以从二人之间的简
单博弈扩展到整个人类社会。且合作形式各种各样，如市场交易系统、委托代理
(合同)网络(虚拟组织)及各种组织类型、国家制度等；二是如何引导具有“囚
徒困境”式的纳什均衡解阿合作方向转化问题。因而，合作博弈理论为其它分析问
题提供了基础。三是在制度设计方面。合作依其福利性质的不同，可以有不同理
解。一是从合作可以带来的团体收益增加时，我们必须考虑一种合理的制度来引导
参与人走向合作，打破“囚徒困境”均衡；二是当参与人可能在一个组织内结盟获
得个人支付和联盟支付但又与组织目标相冲突时，如何设计一个机制满足“囚徒困
境”条件。
沟通多人之间关系的纽带是收益或支付(效用)、讨价还价过程和联接的性
质。参与人的基本选择问题也可以归结为两个投票过程：
(1)以足投票过程。当参与人的个人理性条件或参与条件不能得到满足时，意
味着参与人将选择放弃参与这一合作过程，即对制度的收益及分配规则投反对票。
广泛讨论的逆向选择过程是这种投票方式之一。
(2)讨价还价过程。进入合作结构的参与人还有更多的选择自由：路径选择、
机制选择、规模选择和绩效控制。值得注意的是，一个合作组织的发起人在选择参
与人时总是一个带信号的筛选过程，这会引起信号策略行为。当信号不具有很好的
性质、或成本过大或信号策略行为时，就不能对参与人进行准确的识别，需要补充
信息才能识别出其真实类型，但可以通过扩大信号搜寻空间及后续的讨价还价过程
才能完成。
华中科技大学博士学位．论文
============盏=；===========篇==========釜== ：=
2．1 N人博弈关系理论
2．I．1 n人博弈中的合作
设参与人集为N=(1⋯2．．，n)，用一个R”的一个闭凸子集F表示局中人一致行动时
可能得到的可行支付配置集，令(v．，．¨，v。)为保留支付(或不一致点)，并假设
{Y∈Fly，≥v．，Vi∈N}是非空有界集，那么局中人之间可能出现各种组合关系来代
表不同的合作水平。相应地，参与人可能把选择合作对象、合作规模等作为策略之
一O
一般来说，理论上一个集合N荐在着以下各种可能关系：
1)结盟策略
由于N人合作面临着可能的cI+c；+c；+⋯+c嚣+c菇=2”一l喘合作状态。
其中，Nk中的任何一种合作都是参与人集的一个子集，这种子集代表N中的s个
人采取一致行动，使s个参与人就像一个人行动一样，这种子集被称为联盟。一个
N人它代表着各人独立行动、任何二人结为一个集团合作行动、任何三人都结为三
人集团等。当所有人结为一个大集团时，N个参与人就像一个人一样行动。因此对
于任何一个参与人，以给定参与人集时，它有2“一1种联盟策略选择空间。
2)合作中的支付
对于任何一个联盟J∈N都有一个相应的收益v(s)与之对应。它代表着s个人
采取一致行动得到的联合支付。一个把“收益或效用”v(J)分配到N的每一个联盟
S的规则(或函数)v叫做一个特征函数(characteristic function)圆．我们可以将它表示
成：v：2”·R。对于空集妒，规定v(声)=0。对偶(Ⅳ，v)叫做一个特征函数下的n
人合作对策。由于合作中的收益可能以很多种形式表现出来，因此它代表的意义就
非常灵活。在具体运用时，完全取决于我们研究阎题的需要。例如，在公共决策时
它是费用多少，它也可以是效用，投票中是否取胜，合作或合谋中的收益等。
3)势力度量
一个人具有广泛的联盟选择的策略自由，从而使它的特殊利益能够得到有效的
保护。这种策略选择的自由性赋予了参与人一定的市场势力，在合作博弈中一般用
势力(power)来进行度量[221。从目前已有的众多文献中可以发现，有许多种衡量
。在∞+6)”=coaob”+⋯+c：口”bo中．令萨护l可直接得到上式结果·
。本处的特征函数足指在可转让效用下的特征函数．对于出现法律禁止、巨大产业进入壁垒等带边支付状况情
况时，许多效用或收益的转移(如行贿)是不能够或不允许的，此时只能出现角点解·
12
个人势力的指标，它们分别代表不同博弈环境下n人博弈的均衡解。其中最普遍最
基础的指标有Shaply值、Banzhaf值Myerson值和Oven值等。势力指标一般可以
标准化为O—l之间的一个指数。当某人在一个特定对策局势中的势力为0时，我
们称之为“哑元”。当一个人的势力为l时，它是一个独裁者。由此看来，势力是
众多博弈中的一种加权值。
4)n一人博弈中的结盟问题与可能的博弈状态
n人博弈问题可以假设为是一个n人讨价还价问题，其支付由纳什积(Nash．
product)给出．然而，由于所有参与人都需要进行充分的谈判并需要完全的信息。鉴
于完全信息和无交易成本不是现实世界的真实状况，参与人之间会形成各种类型的
交易或博弈机制来缓和这一困境。特别地，参与人之间的互相结盟行为更另引人注
目。所谓结盟，就是参与人之间把选择不同的合作水平看作是一个重要策略，这在
企业团队生产、投票及其它许多必须求合作才能取胜的群体行为中最为普遍。一般
来说，n．人博弈会出现以下几种典型问题：
2．1．2囚徒困境问题
当所有人都各自独立而缺乏协调时，相当于n人非合作博弈解。N人非合作博
弈可能会出现多重均衡及多理纳什均衡解。其中最差的一种纳什均衡解是，所有人
都处于一种最低的支付水平之上。
集团或(联盟)问题参与人上升时，可能因某种原因导致n中的s个参与人集体
一致行动。此时，一致行动收益必然大于单独行动的收益。
总体(大联盟)问题当N中所有人都采用一致行动时，N人就像～个理性人一
样。不存在N的这样一些子集，它给予参与人的收益超过大联盟给予的收益。
2．2多人博弈中的合作：假设环境
1)结盟自由假定
在衡量参与人的势力时，有一个基本条件是，参与人具有退出和进入某一联盟
的自由选择权利。在此基础之上，参与人只根据自己在联盟中可能得到的预期支付
来选择究竟加入那一个联盟。同时，每个联盟都有形成的可能性。自我选择是经济
主体进行策略选择的基本条件，一个联盟是否稳定在合理的均衡水平都必须以此为
参照。任何强制参与的集体行为或合作联盟都将破坏这一标准，因此在分析类似强
制合作的制度环境下的合作行为都要严格注意这一点。
2)预期收益最大
华中科技大学博士学位．论文
预期收益最大是参与人进行联盟选择的唯一标准。参与人在几种不同的收益水
平下选择是否加入某一联盟的。只要参与人收益稳定在最大收益的联盟是，该联盟
将稳定。否则，参与人会以各种方式探索更有利的参与方式，如放弃参与、组织内
合谋、跨组织合谋、选择努力水平等，使自己收益与贡献相一致。虽然组织(联
盟)内存在各种形式的监督过程，但由于信息问题和合同的不完全性，往往会使监
督成本足以抵消任何收益的增加，从而便监督变得无效率。
3)交易或结盟成本最低
交易成本或结盟成本是限制联盟形成的重在逆转力量。虽然理论上可能存在许
多种结盟形式，但是可能由于转化成实质性起作用的联盟的诸多障碍，我们必须排
队它。交易费用标准可以结合到收益标准中去考虑，从而使我们只用净收益最大标
准即可。但是，由于人们总是从预期收益去进行探索结盟的可能性，然后再从成本
角度来权衡行为选择问题，因而分开来讨论比较合适。更重要的是，对于一个有效
率的合作组织或普遍存在的合谋组织问题，我们从成本角度进行诊断：那里是否存
在一个利于合作或合谋的交易成本节约机制?当我们引导合作结盟行为时，如何创
造这样一个机制?而在合谋行为广泛出现时，我们如何从交易成本角度出发，增加
合谋成本从而斩断合谋形成的廉价机制?
2．3非结构性问题
非结构性问题是指在一个n参与的博弈局势中，每个参与人之间都具有相同的
机会相互结盟、沟通。在不考虑交易成本的环境下，每个参与人都对整个联盟的成
本、收益具有完全信息。即参与人处于一个“廉价对话”的对称环境下，不再受制
于某一具体情境的制约。这种情况是现实的一种理想化：因为它意味着所有联盟都
有相等机会形成。不过它也对应着完全连通的网络情况。此时，矩阵没有O元素。
如果我们面临一个具体的多人博弈关系时，结构化可能是较为方便的。在不考虑联
通结构的情况下，任何两个节点之间具有完全的联通性。因此这个网络是均匀的。
2．4结构与委托代理网络问题
n人博弈可以用一个网络来描述。网络是图论中的一种解决结构化问题的手段
之一。一个n人博弈问题转化为图的语言和过程如下口31：
一个N人图G是由参与人集联结的空间拓扑结构，其中结点集对应所有的参与
人集，枝或联线表示局中人对之间的联系，这种联系在不同的具体问题中代表着不
华中科技大学博士学位论文
同的意义。例如，在一个社会交易网络中，它代表通讯沟通或友好联系；在区域之
间关系中，它代表区域之间的自然、社会经济联系；在一个由多人组成的委托．代理
网络中，联系最可能的方式是合同或讨价还价等过程。因而令厶(Ⅳ)代表所有局中
人组成的集合，即：
L2(Ⅳ)={{f，，)If∈Ⅳ，J∈N，i≠，) (2—1)
于是，厶(Ⅳ)人任一子集可称为局中人集上的一个图或图合作结构。结任一这
样一个图G、任一联盟s及任～S中的任意参与人t_，，我们说它们是在s内由G连
接的充要条件是存在某个分划(hi，h：，．．，以)，使得(hi，h：，．．，以)￡s，啊=f，h^=J，且
对每个，都有(^，，啊+，)∈G。令s／G表示s划分成被G在s中连接的局中人集所组成
的集族，我们说联盟是受制于图结构限制的。
1)图的更一般表示
定义：一个图是一个有序二元组<v，E，p，记作G，其中，
(i)V≠矿称为G的顶点集，其元素称为顶点或结点。
(ii)E称为边集，它是无序积V&V的多重子集。其元素称为边。
在图中，顶点个数称为图的阶，一个n人结点的图Iy(G)l-行称为n阶图。若
E(G)=0称为零图。顶点集为空集的图称为空图。
2)图与n人博弈的等价表示
图论具有非常复杂的理论背景，它直接产生于实践中。由于n人博弈理论本身
存在的理论缺陷，在对于解决复杂的社会问题时，很难通过其简化形式进行建模，
因此它的早期应用受到了限制。然而，如果我们根据实际问题的条件，把一个n人
博弈问题转化为图结构进行描述，那么我们立马发现它的用处了。并且它可以直接
利用图论的理论进行博弈描述。在本文中，作者就曾经发现了其中的好几种扩展运
用，例如图是一个组织时内部树之间的竞争；用图进行道德风险诊断等。
目前的网络理论模型虽然不算主流，但从事这一工作的也不少。比较突出的文
献列于后面的注释中以节省篇幅①。不过，由矩阵来描述网络结构并直接通过矩阵
运算去寻找网络特征并不普遍。
。目前比较有影响的网络博弈文献较集中地收录在v．bala and S．Goyal(1999)等文献综述中a由于没有较完整
的资料，本人涉足该领域时有诸多困难，幸好互联网提供了这一向导．按照“小世界理论”，一个随机网络只
需几步就能保持与世界沟通。本文引用这一方法去探索可能的文献时非常成功．确实，只需要2--4步，就能对
该领域形成一个较为完整的印象．目前网络博奔理论的进展主要体现在以下几个方面：(I)网络形成理论·著
名的有M．Jason(1996．2000)，Myerson(1977)：他们介绍了如何组网的规则及各种关系的定义：(2)网络讨价还
价问题及均衡解问题。B．Dutta and Jackson(2000．)．_lyerson(2001)等较为成熟；一般来说，网络的均衡解事
实i：与纳什讨价还价解及shapley值具有极其相同特征．(3)网络学>-7和进化均衡问题·在V．bala and
华中科技大学博士学位．论文
2．5合作的协调及协调人的作用
由于分散群体内部存在着众多联盟的可能性，合作问题就变得非常艰难。在一
个小群体内，通讯或合同都能协调参与人行动，因此焦点均衡(shilling，19)o的寻
找并不是一个太难的问题。但一旦把适用于小群体的合作扩展为大群体分散博弈过
程时，我们发现它需要太多的沟通、讨价还价和交易费用。因此讨价还价解是不适
用的，合作解的保证条件极其苛刻。为了缓和这一矛盾，社会或自然系统进化出了
一系列机制来处理它。即通过不同的协调人的作用，先把分散的群体合成为一个个
小的群体，这种群体我们可以将之看作是联盟状态。联盟进一步合并，形成一个更
大的联盟。这一过程在社会组织中最为普遍。例如，全世界50亿人可以看作是一
个分散群体。这些群体通过基层行政组织、企业组织、社会组织等合成为一个个小
联盟。从而地方行政官员、业主等代表一个群体，从而减少了参与人。进一步合并
到国家、区域联盟(欧盟、OPEC)等。在国际层次上，就有国际公法、私法和示
范法来协调国际行动和解决法律冲突问题。这样，每个国家都作为一个独立的参与
人出现，50亿就简化为188个参与人。然而，这还不够。冷战时期，世界基本上是
被简化为两个鲜明的竞争性集团，而在多极化世界中，区域组织则作为一个参与人
形象出现。
在本文结构中，主要回答了协调人方面的两个问题。一是大群体必须经过联盟
化过程才能统一协调行动。然而这一过程是昂贵的和漫长的；二是当一个广泛认同
的协调人突然消失或出现策略不稳定时，群体合作过程将会迅速解体为众多的竞争
性联盟。从这一角度分析问题，目前尚未见诸博弈认文献。
s．Goyal(1999)，Jackson and Watts(1999)：和S．Goyal and Veg矿Redondo(1999)三篇论文中，可以看出，通过
∞网i射林络学(习s过h1e9程6l0l焦将点in导均g衡致网是络博：弈琵论蠹中器箍的．重博要弈概论念中的．重许要多概种念途．许径多都种能途蟹径都保能让够返保一证聚这一熏聚坦焦程过圈程买的实挑现，，足只置要
它足纳什均衡解之一．Harsanyi和selten(1988)认为帕景托最优的纳什均衡自然是焦点；Russel-·cooper
过理论和实验角度证实，只要具有互补性，均衡的聚集可能性就存在·
3简单加权投票对策：公司股权与势力不对称问题
联盟或合作博弈理论的一个重要应用是在诸如各类(0，1)型集体选择问题中。这
类问题在费用的合理分摊、政治投票设计、公司内部股权的合理分配等方面的应用
非常广泛。
股东控制公司的～条重要途径是通过持有公司股份，因此许多研究者把股东行
为动机集中在占有公司股份的大小上。这种假定认为股东对企业的控制与占有股份
成线性正相关。然而从近100多年西方国家企业股权控制比例看，存在着一种股权
越来越分散的趋势，而且也并没有证据证明股东对企业控制力的下降。有时一个股
东只要占有一个很小的比例，就足以对企业行为产生实质性影响。这样，一个股东
就可以用很少的钱完成对多个产业或企业的控制。这说明企业追求的并不是股权大
小，股权大小也并不与控制力之间存在简单的线性关系。事实小，股东对公司控制
过程应该是通过控制能力而不纯粹是股份比例的大小。这种能力在本文中称之为势
力。股份大小与势力成正比，但不是一个简单的函数关系。从投票角度来说，一个
大股东有时完全处在被动地位，而小股东却能获得与份额不相称的势力，这完全取
决于股权结构状况。本文从一个简单的案例入手，分析了处于不同结构与情境下股
权结构与势力结构的变化。从中可以看出，结构还往往对应着参与人内部冲突的可
能性。
按照一般的理解，一个公司中股东的股份反映了他在公司重大决策上的发言
权。因此，在许多公司重组过程中，最艰难的谈判过程就集中在股权分配问题上。
然而，在一个多股东的公司中，股权比例固然反映了公司内部势力结构，但股权结
构是否和其势力结构相对称呢?
2002年8月18日，武汉航空公司与东航重组成功，新公司中的四个参与人分
别武航、东航、上海均瑶集团和武汉高科控股集团有限公司。根据协议，武航、东
航、上海均瑶集团和武汉高科控股集团有限公司四方出资比例分别是40％：40％：
18％：2％。新公司成立的领导成员构成为4：4：2：1。本文就借这一案例来对公
司内势力分布及策略行为进行简单的分析。但即使如此简单的分析，也会发现一些
与常识极不一致的结论。文中使用的方法使用的是n一对策中简单多数加权对策，
它一般用于政治决策、公司决策中的势力分析。
3．1加权投票对策
3．1．1加权对策的表示
一般来说，股份公司的股权总是通过某种合理的分割技术细分后，被相同或不
同的股东所拥有，因而股东为争取公司的控制权进行博弈。对于公司的股东，他们
追求稳定的投资收益率。因此它们是一个典型的最大最小化经济人。
股东在公司内部为了各自的战略利益结盟，取得合作收益最大化。合作联盟反
映了各自利益一致的一面；但是，当风险、经济机会评估上的差异及公司内的代理
状态出现的不良行为，他们之间也难免会发生各种利益冲突。而公司内部一旦发生
冲突时，股权结构的一个重要用途是可以通过投票来解决。因而每个股东都是局中
人，他们之间形成了一种n人对策。股东手中掌握的份额代表各自的权数。
由于股权不是均衡分布的，不同的参与人的权力并不相等，因此该对策是一个
投票加权对策，一个加权对策记为：
【q：Ⅵ，"W2，⋯，Wn】
这里有n个局中人参与投票过程。Wi是第i人手中的票数，或权数。在本例中
权数分布为： t40％，40％，18％，2％)。
设N=(1，2⋯n)是所有投票人的集合，N的一个子集s为投票人组成的联盟或
集团。如果在投票结束后一个联盟能赢得一次表决，则称其为取胜联盟。既：
r1
v(J)={：，如果取胜为1，它在公司中可以表示为一次表决获得通过a否则为
⋯
0。
口代表通过某项决议所需的最低票数限额，这个限额一般可以自由调整。而取胜
则是指：
Σwf>-q (3-1)
ills
既票数超过最低限额时，决议通过。在公司投票系统中，一般假定q>-{ΣW．。
ten
即，超过51％的票数就能取胜。
3．1．2投票联盟及关键人
理论上一个n人博弈存在着c；+c：+。，N=2”一1个联盟类型a其中cj代表N
人独立行动，所有人都不参与结盟过程；而c：=1则代表所有人都结为一个大联盟
～一华中科技大学博士学位．论文
22222222222222222222====；============一=；
采用一致行动。处于中间的有2人结盟、3人联盟等。正是参与人具有在不同水平
上选择结盟的自由，导致了不同的势力结构，使权数与实际势力的不对称。在本文
案例中，假设任何联盟都是可以形成的，并且其形成的概率相等，那么上面案例中
的4人组成的联盟将是下面的排列，～共有n!=24个。各个可能的联盟列于表(3—
1)中。
12 4
34
12‘43
143‘2
13
6
42
142‘3
13‘24
表3-1 24个合作联盟
2l“34
2l‘43
243‘1
23‘41
23‘14
24】‘3
31‘24
3l‘42
32‘14
32‘4l
34I‘2
342‘l
在上面的24个投票排列中，每一种排列都代表着一种联盟状态。如果某人的
加入正好使投票数达到或超过51％，那么他们就能够左右公司的一些重大决策。此
时我们说该参与人的加入就能够使一个失败联盟转化为一个起作用联盟。那么此人
在该联盟的取胜中就是非常关键的，且是最经济的。说它是关键的是因为一旦它退
出该合作结构，该联盟将解体(不足51％限额)；说它是最经济的，是因为它处在
边际最大化水平上，少他不行，有了他以后再多增加票数又显得多余。上面表格中
的““”号标出了所有联盟中的关键人。例如，“12‘34”表示2的加入就能使票
数超过51％从而使“12”取胜，因此在1和2组成的联盟中2是关键人，对于
“34”来说，它们都是多余的：而“431‘2”排列则表示参与人l在该三人联盟中
是关键人。因为1不参与时，(4，3)的票数总额为20％，达不到过半要求。而当
2加入时，票数已达到70％，完全不需要吸收1再加入。我们把上表对应地转化为
下表(3．2)就能清晰地看出这一点。
9
3
2
l
3
2
l
^
^
^
^
^
^
化
m
仍
似
州
抛
华中科技大学博士学位．论文
表3-2取胜部位及关键人
排列或联盟类型取胜部位(5l％) 票数(％) 关键人
1234 12 80 东航(2)
1243 12 80 东航(2)
1432 143 60 上海均瑶集团(3)
1342 13 58 上海均瑶集团(3)
1423 142 82 东航(2)
1324 13 58 上海均瑶集团(3)
2134 21 80 武航(1)
2143 21 80 武航(1)
2431 243 60 上海均瑶集团(3)
2341 23 58 上海均瑶集团(3)
2314 23 58 上海均瑶集团(3)
2413 241 82 武航(1)
3124 3l 58 武航(1)
3142 3l 58 武航(1>
3214 32 58 东航(2)
3241 32 58 东航(2)
3412 341 60 武航(1)
3421 342 60 东航(2)
4123 412 82 东航(2)
4132 413 60 上海均瑶集团(3)
423l 423 60 上海均瑶集团(3)
4213 421 82 武航(1)
4312 431 60 武航(1)
4321 432 60 东航(2)
40％：40％：18％l 2％
3．2各个参与人的势力度量
3．2．1投票博弈中势力概念
股东的最终目标是控制企业而不是单纯的追求股票份额的大小，追求股票份额
只是股东达到控制企业的一种手段。仅仅从控制企业角度出发，一种经济的控股方
案应该是恰好达到能够控制企业但又不需拥有过多的公司股权。由于股权与势力并
不是一种简单的函数关系，有时一个股东能够“杠杆式”地操纵企业，使其股票份
额与其实际作用达到明显的不相称地步【2”，这～点在本案例中表现得最为突出。
由股权结构和限额所决定的实际讨价还价能力，构成了参与人的势力。势力指
标往往比股票份额的关系更加微妙。从策略上来说，参与人真正需要的是市场势力
而不是份额，因为有时拥有较少股票份额就能获得相当大的公司控制权；从讨价还
价能力来说，一个拥有较大势力的股东能够操纵公司分配方案、重大人事变动及投
资决策权，因而他的个人利益能够得到很好保护。在早期资本主义时期，股东一般
通过追求股票份额的绝对优势来展开对公司的控制权竞争。但是，由于中产阶级兴
起导致股票分散在一个“海洋”之中，掌握过多的股份是完全不必要的，有时甚至
是违法的。因为势力分散比股票比例分散的要快得多。
在设计到投票阎题时，有几个关键概念需要在此特别提及。在一个对策中，无
实际投票势力的局中人被称为“哑元”，相应地他的势力为0。因为任何联盟如果
已经取胜，那么排除它依然取胜；如果是失败联盟，吸收他仍然不能取胜。如果局
中存在这样的参与人，它能够有效地控制任何表决，即，他能保证投票决策通过又
能够否决他不满意的任何决策的话，那么它就是一个独裁者；如果没有某人的同意
任何联盟都是徒劳的，那么该人就有否决权。势力既反映了局中人通过结盟获得稳
定收益的能力，又反映了他阻止别人结盟分割自身利益的能力。
在本文出现的公司股权结构中，我们发现，仅仅从投票角度看，武汉高科控股
集团有限公司将是一个“哑元”，而该对策中不存在“独裁者”，也不存在谁具有
否决权的问题。因为任何一个大股东选择弃权或投反对票都不能够阻止其它股东形
成起作用的联盟。不过，上海均瑶集团在该对策中的特殊表现仍然使该股权结构具
有许多特别之处。这将在以后的分析中可以到。
3．2．2各参与人的势力度量
参与人势力是指在给定对策中某一参与人对公司实际控制能力的度量。一个
势力指标应该具有以下的一些性质，它是：
(1)一个势力指标应该是一个函数K，对于对策中的每个局中人i，规定一个非
负实数足(f)≥0；
(2)实数K(i)应该仅仅依赖于取胜联盟集∞，此外若f，-，关于珊有对称的地
位，则应有K(i)=K(，)；
(3)当i是哑元时，有足(f)=0；
(4)在加权投票对策中，若∞．>_彩，时，有K(i)≥K(j)；
2l
华中科技大学博士学位．论文
(5)≥：K(f)=1
塘N
条件(1)说明，在一个参与人集中个人势力不低于0，因为他总有一个参与条件限
制它。低于该条件时，参与人可以选择放弃进入游戏：条件(2)说明分配只发生在取
胜联盟中；条件(3)是说“哑元”不参加分配；条件(4)说明增加额外的票数决不会损
害局中人，但并不一定对他有什么益处；条件(5)仅仅是为了规范化，在它的约束下
势力是O一1之间的一个指数。
势力指标可以通过公理和概率两个方面来刻划，下面我们仅仅列出公理刻划。
若Gl=(Ni，q)和G：=(Ⅳ2，∞：)是简单对策且Ⅳl，Ⅳ2不相交，定义积对策
G。oG：为如下对策：局中人集是N1 UⅣ：，取胜是指在两个对策中同时取胜；和
对策G。oG2局中人集也为NIUN2，取胜是指在GI=(NI，q)或者G2=(N：，∞2)
中取胜。定义：
G。vG：是一对策，局中人集Nl ON2，取胜联盟是指在G1，G2中都取胜的联
盟：
Gl AG2是一对策，其局中人集是Ⅳl UⅣ2，取胜联盟是指至少在G1，G2中之一
取胜的联盟。
那么当ⅣI，N2不相交时，Gl VG2=Gl oG2，GI AG2=Gi oG2 a通过对原始
对策GI，G2中添加作为哑元的局中人后，局中人集为Ⅳ，那么Dubey(197s)的合成
公理为：
七．(G1)+七l(6k)=七。(G1 AG2)+七．(GI VG2)， (3—2)
其中k表示一般的势力指标，如声，声，P等。或者说，参与人f在两个对策GI，G2
中的势力之和应该等于他在Gl^G2和Gl VG：中的势力之和。这一结论的深刻之
处是它可以用来进行制度选择和在不同制度中的参与人势力分析。
从上面可以看出，n．人博弈中存在许多种度量参与人势力的方法。我们应得最
多的是Shapley--Shubikl251值和Banzaf【261值，他们都分别满足以上公理条件。其它
的还有owell值、迈耶森值等。下面就用以上两个势力指标来分析本例中各参与人
的势力分布。
1)Shapley--Shubik值
在一系列假设下，Shapley和Shubik引进了该指标。它是冯．诺伊曼和摩根斯坦
利多人合作对策的一个特殊应用。其表达式为(3-3)：
华中科技大学博士学位论文
纯=Σ掣(3—3)
其中s=lSI=S是指联盟中参与人个数，和式取遍所有取胜联盟。其意义可以这
样来理解，有s-1个人已经在i之前加入到一致行动中去，它们共有(s一1)!种排
列。但只有i加入后才能取胜。i后面有个人再加入，所以一共应有(N—S)!种排
列。这样，上式中分子代表实际形成的联盟数，而分母n!表示可能的联盟数目。
从本文4 1=24个排列中，参与人1，2，3各有8次处于关键位置(参见表3．1和表
3．2)。参与人4没有一次处于关键人位置，因此它是一个“哑元”。所以其势力指
标为：
妒=击(8，8，8，0)=聪I，}，{，0)
或者用Shapley指标来计算。由于参与人l在2个2人联盟、2个3人联盟中是
关键的，因此它的势力指标是：办=2．芈+2．罕=}
按照同样方法，我们可以得到局中其它人的势力值。这个值与上面简单计算
所得结果相同，依然是：
≯={{，{，{，0)
2)Banzhaf值
该值不仅考虑参与人的投票排列，更重要的是考虑他们投反对票时对其它联盟
的阻止能力。这种能力表现在两个方面，一是由于它的支持，从而使一个联盟由取
胜联盟变为变为失败联盟；二是当它加入时，使一个失败的联盟转为取胜联盟。因
此，对于表(3．1)形成的各个联盟来说，我们通过观察参与人左右摆动次数导致结果
变化的数量来衡量参与人的势力。记局中人f的Banzhaf值为：
卢=(届，反，．．．，成)
它即为一种新的势力指数分布。下面我们就用Banzhaf值来对本文案例中的投
票行为进行分析。
为了计算该值，先构造4人博弈中参与人赞成(Y)或反对(N)的组合t它共
有24种，列于表(3．3)中的第一列。记联盟失败符号为“F”，成功为“P”，参与
人摆动如果改变了联盟性质则记为“X”。最后最下脚是各个参与人拥有“X”的
次数，这个次数与总联盟数之比就是势力值。从表中计算可以看出，此例中的
Banzhaf值与Sharpley值是一致的。但在一般情况下可能不一致。
华中科技大学博士学位．论文
表3-3 Banzhaf势力指标的计算
参与人通过，否决摆动次数
l(40％) 2(40％) 308％) 4(2％) P F l 2 3 4
Y Y Y Y P
Y Y Y N P
Y Y N Y P x x
Y N Y Y P X x
N Y Y Y P
x 妻x
Y Y N N P
x
妻
萎
Y N Y N P
N Y Y N P
Y N N Y F
N Y N Y F
N N Y Y F
Y N N N F
N Y N N F
N N Y N F
N N N Y F
N N N N F
8 8 8 0
从上面的计算可以看出，公司股权结构中股权数量真的不与自己的势力成比
例。表面看来，参与人1和2都拥有40％的股权，合理的势力应该是在40％左右。
然而实际上他们拥有的势力只有约30％多一点，远不到40％。而参与人3虽然只占
18％的股票份额，但它却获得了与参与人l和2同等势力，其势力值比股票份额值
高出约15个点，而且它还可以把股权比例下降到11％而不会改变其势力。参与人4
虽然拥有2％的份额，但其势力为0。因此，在本例中，上海均瑶集团是一个最大的
赢家，而东航和武航都拥有了过多的股票份额。至于参与人4，如果不附带其它目
标的话，它的利益肯定不能得到保证。不过投资者往往并不是仅仅关注势力，它还
关注其它的利益目标。
3．3联盟形成及势力分布的影响因素
在上面的分析中，我们假设参与人之间行为不受到其它局外利益因素的干扰，
并且相互之间都是根据自己的判断独立作出决策的。同时假定各种可能的联盟都有
等概率形成机会。然而在实际分析各自的势力时，我们必须考虑更多的情境因素。
有许多内外因素的影响，都会使一些联盟会比其它联盟更容易形成。在本文的
的案例中，假如参与人另有独立的投资活动且彼此关联，那么这将构成一个极大的
诱因，影响公司行为；此外，地域相近或社会信念相近、管理人员特征及代理风险
等，都可能导致内部某些结盟行为比其它联盟更容易形成。不过这些细节对本文是
不必要的，我们只关心投票。下面我们来分析可能的投票变化情况。
1)股权兼并及合谋行为
如果企业内部的股权发生了转让，我们假设这种转让是在两个有势力的参与人
之中发生的。那么这一行为将导致股权的进一步集中和势力的集中。但是如果不出
现兼并行为是否会出现类似效果?事实上，如果双方暗中约定决定采取针对第三方
的一致性行动，那么它事实上正具有合并的类似效果。在一个长期互动的公司环境
中，这种合谋这并不难作到。
假设1和3暗中达成了某种一致性协议或联盟，这个联盟对l或2任何一方的
提案都积极配合赞成，对3提出的方案采取拒不合作的态度，即行使否决权。在这
种环境下，我们发现参与人2不仅不能独自取胜，它与4联合也不能阻止任何方案
通过或寄希望自己提案获得通过。相反他们的方案则可以轻易为l和3所否决。此
时2和4～样，市场势力都为0，即，都变成了可怜的“哑元”。或用势力指标表
示如下：
在f51％； (1,3)，2,4)投票系统中，各方势力分布变为：
妒=(矾，，欢，九}={l，0，D)
此时l和3在公司中为所欲为，他们结为一体，既是一个具有否决权的联盟，
又是一个独裁者。同样，如果其它的参与人联合能够通过的话，并采取相应策略，
其势力分布可能不同，但性质是一样的。
2】参与人之间的“争吵”
如果某些参与人之间发生了意见分歧，出现了“势不两立”局面，那么凡是与
之相关的联盟都将成为泡影，从而彻底改变局中人之间的势力分布。例如，假设2
和3之间发生了争吵，那么他们将不会在一个联盟中出现，此时我们在所有联盟中
必须排除包含(2，3)成为关键联盟的所有排列。此时，最小取胜联盟只剩下了16
个。在这16个联盟中，其中有8个联盟是参与人l处于关键位置。2、3都只在4
个联盟中是关键的，此时势力指标分布为：
驴=({，{，{，0)。
显然，由于2和3之间发生了争吵而不愿一起行动，结果使双方势力都受到了
削弱，即，它们的势力都由原来的33．3％下降到争吵后的25％，而参与人1的势力
华中科技大学博士学位．论文
则由33．3％上升到50％。同样，当其它人发生可能的争吵(排除哑元4，因为它是
哑元)时，各自的势力变化如下：
1和3争吵：≯=(i1，iI，{，0)
1和2争吵：矿=(i1，iI，{，0)。
参与人l与3发生争吵与2和3发生争吵具有同样的效果，两个有势力的人发
生争吵都将会削弱双方势力，提高“旁观者”势力。这里，参与人1和2发生争吵
将会出现戏剧性效果，这是一个非常微妙且寓意深刻的现象。在1和2两个大股东
发生争吵时，3的势力将由33．3％上升到50％，而它的股权才占18％。进一步对比
发现，假设两个大股东合作的话，3变成了一个可有可无的“哑元”。而当两大股
东因发生“争吵”而受到伤害时，它自己的势力反而超过了两人势力之和。因此参
与人3完全有动力去挑拨大股东之间的关系，从中渔利。
4．1撬述
4区域互动及策略理性选择
区域和国家之间的相互作用类型，总是竞争、合作、或互补关系中的某一种，
它们之间的互动性质决定了区域动力学特征。目前，区域经济关系研究文献都把注
意力放在均衡与不均衡性质，以及如何保证区域向均衡化方向发展等方面。缪尔达
尔(1965)1．7-71认为，由于人均收入、工资和利润水平等要素收益的区域差异，会吸
引着资金、劳动力、技术、资源等由落后地区流向发达地区(回波效应)；同时，
发达地区发展到一定程度后，由于人121稠密、交通拥挤、污染严重、机会不足等原
因又会使生产成本上升，外部经济效益下降，变得相对不经济，从而使资金等要素
出现反向流动(扩散效应)。H．W．理查德逊(1973年)进一步指出，区域经济应该
在均衡与非均衡两股力量交织作用下增长，其中引起非均衡增长的区域内部经济聚
集和要素聚集是区域经济增长的关键。J．G．威廉森(1965)利用三十多个国家的样
本资料，经统计分析得出了倒“U”性区域增长趋势，初步验证和肯定了缪尔达尔
的推论，并进～步指出：由于经济开发初期“禀赋”和人口分布不均匀，使得以集
聚效果为基础的经济增长必然导致区域的不平衡发展。J．G．威廉森口8】同时认为，不
平衡有其必然的负作用，但一个国家却很难协调这种两难冲突。因此，区域发展的
不平衡是经济增长中的“一种令人讨厌而又不可避免的必经阶段。”缪尔达尔也认
为，“市场力量的作用是倾向增加而不是减少区域差异”。赫希曼进一步认为，如
果没有周密的政府干预，区域差异会不断扩大[291。总体上属于非均衡增长思路的还
有朗索瓦．佩尔鲁克斯(佩鲁)1995年提出的“发展极”概念和理论【30l，认为经济
发展是某一个支配单元起主导作用的不平等和不平衡的动态过程。某些主导部门和
有创新能力的行业集中于一些地区或大城市，形成经济活动中的生产、贸易、金
融、信息、交通、服务、决策中心(发展极)131】。由此产生吸引或辐射作用(技术
的创新与扩散、资本的集中与输出、产生规模经济效益、形成集聚经济效果)，促
进自身发展并推动其它部门和地区的经济增长。
生长极理论和地市化理论都是非均衡论，它反映了区域经济增长的重要特征。
生长极的成长趋势是经济增长首先是从某一点开始引爆，然后爆发式成长。这方面
的例子很多，并且是区域经济增长的一个普遍现象。例如我国的深圳和早期的十堰
等都几乎是在“经济荒漠”中快速成长的。而城市化过程则指在一个区域内，由于
周围人口、资源的快速集中化，结果使一个均衡区域分化为特征明显的两个区域：
农村和城市的现象。以上几种理论都揭示了区域经济发展中的几种重要力量和现
象：
1)区域经济存在自强化机制和“拥挤”问题。
自强化性质体现了区域经济的聚集效果，它使具有资源优势的区域呈现一种增
长趋势。这一聚集效果来自多个方面，最基本的有：巨大的交易成本节约
(fisher,1988)[321、消费或生产上的规模经济、分工导致的交易效率上升(杨小
凯，1997)1331、外部经济效果(simulson，1994)134]等。但是当区域经济发展到一定
限度后，拥挤便会出现，“拥挤”规定了区域增长的上限。拥挤说明区域分工潜力
已经耗尽，资源约束和外部不经济等压力开始上升。
2)互强化(竞争与互补)与社会磨擦问题【351。
互强化表现在两个方面，一是具有竞争优势的区域逐渐得到强化，结果使周围
的资本、人口、技术等快速或逐渐卷入该区域，它的结果是一个区域的成长伴随着
另一个区域的衰落过程。二是如果两个互动区域双方具有专业化比较优势，这种优
势且是互补的，那么两个区域之间将会产生正的外部性。一个区域的发展必须依赖
另一区域的发展。
资源竞争必然引起区域的社会磨擦。所谓磨擦，是指区域之间的发展过程同时
伴随的另外一种力量，它阻碍现有趋势的正常发展【36】。区域磨擦问题既表现在区域
内部，也表现在区域之间。
现实中，区域经济关系往往是以上关系中的一种、两种或同时具有这些特征。
只要两个区域之间还存在交换关系，我们可以基本判断它们具有互补关系，否则交
换不会发生。
作为区域经济中的问题，一是要揭示相互关系及不同关系下的均衡性质及经济
绩效。显然区域经济之间具有复杂的经济关系和均衡性质。城市化和某些区域经济
爆发式成长明显说明了区域经济的不均衡特征，且是发散的；而我国70年代末到
90年代末东西部经济一出现了由均衡到不均衡，再趋于均衡，最后又彻底分化的过
程，显然这是一个比较典型的鞍点均衡性质。由此可见，对区域经济关系的认识，
即存在内在规律性，但并不简单。
4．2区域相互作用方式
现代经济特征可以归纳为三个方面的相互综合作用。一是区域本身经济体系的
增长问题。这种增长与自身的经济结构、资源限定的潜在产出规模有关。一般来
华中科技大学博士学位．论文
说，经济增长理论所讨论的理论范畴原则上也适用于区域经济增长理论；二是在开
放环境下，区域相互作用造成的网络外部效果，这种效果同时考虑区域之间的需求
外溢、产品和要素的流动等带来的竞争和互补关系：三是区域之间政府的经济政策
对系统运行的控制。政府不仅调控着自身经济增长规模和结构，而且通过贸易措施
限制资源、产品的流动方向和规模。由于区域关系接近于生态种群的消涨规律，因
此本文将模仿种群互动的微分方程方法(徐克学，2001)137]，来模拟区域经济之间
的关系。
4．2．1模型
假设，区域之间的经济规模分别为Ⅳ。(f)，Ⅳ：(r)，它可以是GDP或某种综合指
数。其经济增长率孚与自己的经济规模成正比，既竽=口lN。。同时，考虑区域之
间的相互作用项，这一项与两种经济相遇(开放程度)±b。，ⅣlⅣ，成比例。取正号
表示双方具有正的外部性，而负号则是互相限制关系。同时任何经济都存在着自身
“拥挤”问题。因此需在方程中加入一个负的平方项，显示资源对区域经济增长的
限制作用，既：一qⅣ?。在此假设下我们主要讨论以下几种区域关系：
1)自给自足
在不考虑相互作用时，区域处于自给自足的封闭状态。此时，区域经济的增长
规模完全取决于区域内部的资源限制。在上面的假设中，我们令第二项0。那么，
等=aN，(1一N。) (4—1)
(4．1)式表明，有两种力量在左右着区域经济增长。一种力量是经济的自然增长
趋势，它推动经济规模里发散式成长；另外一种力量是，当经济增长到一定阶段
后，由于资源限制、过度竞争、社会磨擦等原因限制了它的成长，因此存在着增长
的极限问题。该经济增长曲线是一条Logistic曲线。
2)区域相互作用
在(4．1)式中，如果第二项不为0，那么它们之间将会产生外部性。这种外部性
将使区域经济关系出现竞争与互补两种性态。当一方对另一方的作用为正时，一个
区域的经济增长将导致另一个区域的增长，这种经济性质一般也称为经济的网络外部
性(network Externality)【381。在国际经济和区域经济关系中，这种现象是极其普遍
的。其内在机制是，一个区域的经济增长后，导致的需求外溢(消费需求、投资需
求、政府购买和进口的增加)、“拥挤”导致的资本输出等，都能促进对方的经济
增长；当一方对另一方的作用为负时，由于存在着资源(要素)及产品市场的竞
争，双方是此消彼涨的竞争关系。例如，竞争区域中一个区域的异常兴起将导致对
方区域的人力资本、物质资本大量流入，结果进一步导致对方供应链的崩溃、企业
竞争力丧失等，都对对方经济产生负的效果。
(1)区域竞争模型
J丁atvI；alIⅣJ～a|2ⅣlⅣ2一atjⅣ?=ⅣI(all一口12N2--G13Ⅳ1)=Ⅳl八Ⅳl，N2) ，^m
惮dN2=口2lN2—17／22ⅣlⅣ2一a23N2=N2(a21一Q22NI一口23-'V2)=N2f(Nl，N2)P纠
(4-2)式右边第一项的意义是，一个区域经济增长率与现有经济综合实力成正
比，它是一条指数增长曲线；第二项代表区域经济增长与开放程度(与竞争对手相遇
的概率)成反比。同时，自身的限制性力量为上式中第三项。等式最后一项表示它
们之间的关系取决于自身力量和相互作用项。
(2)互补关系(互强化)模型
J譬=qlⅣI+口12ⅣlⅣ2一q3昕=Ⅳ1(口ll+allN2一a13Ⅳ1) ，^，、
l譬=口2lⅣ2+％2ⅣIⅣ2一％Ⅳ2---N2(a2I+％ⅣI一口23Ⅳ2) ”⋯
(4—3)式第一项与第三项的意义与(4-2)式相同。不同的是第二项，它显示地取正
值。其代表的意义是，区域之间是互补的。并且双方存在一种相互强化作用。
当然，以上模型并不需要都是对称的。在实际经济行为表现中，根据区域经济
关系的现实情况，调整以上各项的符号。例如，当一个区域对另一个区域只输出资
源时，它是一个捕食模型。
3)区域经济关系的一般模型
当把(4．2)和(4．3)式中的模型扩充到n1个区域时，我们可用统一的方式给出
区域互动的矩阵表示式(4．4)：
d
●一
dt
Nl
N2
_●●
N
m
N2
]r kl
8 k2
|I．．．
Nm业km
+ 臻artd．矗．-atom且21 22 2m睦2 a a ⋯ 8 《N
amI Nm
+
V1
V2
●●●
Vm
(4．4)
其中，七．卜O表示区域经济体的自然增长率是正的，v，表示第f个区域经济增
长的外溢效果，a。表示区域之间或经济主体之间的相互干扰系数。若该系数大于
零，则说明区域之间具有正的外部性，即一个区域经济增长将带动其它区域的经济
增长，此时我们也可以说区域各方具有互补性；小于零则代表负外部性，即一个区
域的经济增长往往会导致另一区域的没落：等于0意味着自给自足，区域各方的经
济增长与对方是互不相关的这种模式也适用于国际经济互动关系，例如，当我们把
区域经济关系扩展到国际贸易时发现，美国经济增长将可能导致全球经济复兴，而
我国与东南亚产业结构相似的国家产业之间则具有替代性。
(4-4)式中最后一项是外部干扰项，它代表着政府干预或随机的外部冲击等。不
过，它在本文中不存在特殊的分析意义。如果是～个控制问题或风险管理问题，该
项特别重要。
4．2．2区域动力学及策略均衡
区域经济关系取决于相互作用的形式，既取决于以上微分方程解的性质。根据
动力方程的解及轨迹的性质可知，如果，氏y)和G氏y)出现不连续不可微，或
者F@y)---o，G@y)=D时，我们说它可能在某些点出现了奇点，这些奇点就
是平常所说的均衡状态。区域经济关系的本质现象常在奇点领域表现出来。
区域之间的经济表现取决于均衡点(奇点)及其邻域的性质。而这些性质又取
决于内部力量对比、初始条件。(4．4)式代表的区域经济增长曲线都会以某种方式结
尾，也就是说，有一种内在的力量驱动或拉动着双方向某一终点方向运行。这种终
点被称为“吸引子”，它是一种极限集合。
如果时间趋于无穷大时，双方都趋于一个与时间无关的定态，既相空间的一个
特定点，此点既为不动点。不动点及其附近的行为表现决定了区域之间的行为及稳
定性。两个区域经济趋于不动点(均衡点)的方式有中心点均衡、结点均衡、焦点
均衡和鞍点均衡等。
1)结点均衡
结点均衡包括稳定结点和不稳定结点两种。如果存在一种力量使双方无限集中
于一点，既为稳定结点。如果解的轨迹是从结点向外，区域经济的变化表现是不稳
定的，发散的。我们现有文献所追求的区域均衡概念就是指稳定结点均衡，而当经
济从稳定节点处开始出现分化趋势时，我们说它是不稳定节点。
2)焦点均衡
焦点是相平面内流线呈螺旋形收敛于一个点，该点就是稳定焦点。或从该点发
散出去呈螺旋式运行。趋于焦点均衡的时间过程是阴尼振荡的，说明了区域之间竞
争互有消涨，但最终都会趋于均衡，或区域以此方式开始加速分化。事实上，区域
经济过程可能最多的表现形式是焦点均衡形态。
3)鞍点均衡
鞍点的运动规律是，两个区域在开始时双方都先向鞍点靠拢，逐渐趋于均衡。
然后双双又离开该点向其它方向散开。区域经济关系在鞍点是非常有趣的，如果双
华中科技大学博士学位．论文
方处于该点时，它们将是均衡的，然而这个均衡点却极不稳定。如果有一个偶然的
外部或内部冲击，这种扰动将使双方关系发生完全改变，偏离均衡行为。其最终结
果是，一个区域的兴起导致另一个区域的衰落。上面的竞争模型中，就存在这种均
衡。开始时，双方经济的优势推动区域向一个方向靠拢。但后来，由于区域结构变
化、宏观经济政策调整、对外贸易等原因使一个区域开始占据优势。八十年代后期
我国东西部经济变化经过了这一典型过程。
4)长期发展关系：极限性质
当时间趋于无穷大时，区域经济系统还会出现周期性振荡，既极限环。这意味
着区域之间的经济关系更为复杂。这涉及到微分方程的分叉理论，而研究微分方程
的动态性质及分叉理论是非常复杂的。在本文中，不打算过多涉及这方面内容。
但是，即使从上面简单方程解的性质就可以看出，区域之间的经济行为可能存
在多种均衡形态，简单的均衡论或不均衡论都不能完全描述这一关系。
4．3不同经济关系下的方程解
1)竞争模型
为了分析区域竞争模型，需将上面进行改造。设区域经济规模仍然为N1和
N2。它们的自然增长率分别为a，口：。由于资源限制，区域经济的潜在增长量分别
为两，羁。区域经济增长方程为(4·5)：
譬2口-Ⅳl(1一釉㈤
譬=a2Ⅳ2(卜鲁) ‘。
由于双方之间的竞争或磨擦，将对双方的潜在产出规模产生一个负的影响。因
而(4．5)式中区域互动方程改变为(4·6)：
警2口1Ⅳ1(1一等一口鲁’(4-6)
等=口：N：(1一瓮一∥瓮)
该方程根据初始条件不同，存在四种可能均衡解。既一个结点均衡解
(可,VI-a矾，％乎)，两个角点均衡解和一个鞍点均衡解· 即：
i冠。，o)，(o，羁)，，世l-up，曼妄字)。其中，第一个均衡点意味着，如果双方势均力敌，
各自都有相对优势时，双方将走向稳定的均衡状态；角点均衡解则意味着在某种条
件下，必有一方将彻底衰落，另一方完全占有对方的市场和资源；第四个点是一个
焦点均衡：在开始时，区域双方将逐渐趋于均衡，但一旦有微小的扰动它便向第二
和第三点移动，最终稳定在角点解。因此我们说，这种区域均衡过程就像是在··刀
峰”上行走，随时都可能滑向两边。
2)互补模型
互补关系与竞争关系的不同之处是，双方从总体上是一种互强化趋势。因此上
面互相作用项的符号取正值。其运行轨迹的极限均衡点可能是一种结点均衡点
(每字，每字)。也可能从初始点一直向外发散，呈爆发式成长。如果是后一种情
况，那么区域双方就永远不会再趋同于某一均衡点了。区域互补模型是我们追求的
理想状态，但在实际经济运行过程中它也会受到区域总体的资源限制，因而增长潜
力并非是无穷发散的。例如，当把区域经济扩大到世界经济模型时，确实能缓和局
部资源稀缺问题，但最终我们发现，世界经济的增长前景仍然受到全球资源的限
制，最终不得不放慢经济增长的引擎。
4．4区域策略理性与纳什均衡解
4．4．1不同的区域策略与均衡性质
1)自给自足均衡
自给自足的稳定点之一是它的增长极限点， (N1，N2)。在这种均衡中，区
域双方的经济增长将终止于资源限定的潜在产出或潜在增长率。由于是自给自足，
区域各既不存在竞争，也不存在互补关系。显然，自给自足解是区域是否参与更大
范围分工交换体系的参与条件。低于该条件，说明区域互动将导致它获得的收益下
降，因此它将理性的选择自给自足。
2)竞争均衡
根据M．Braun等(1978)(39】对上面的竞争方程所作的详细分析看出，该方程的均
衡解为i冠、，o)，(o，矾)，(警，糌)。既当区域l具有竞争优势时，所有的资源都会
被它占有，从而它自己将达到最大的产出水平，而区域2最终因为资源流出导致衰
落；同样，当区域2具有竞争优势时，结果是区域l的衰落。若双方势均力敌时将
会出现稳定的竞争结点均衡。但是当区域存在相对的比较优势时，则会出现鞍点均
衡。不过这种均衡极不稳定，因为只需要有微小的扰动时，均衡便会偏离均衡轨道
进入其它区域，最终吸收在角占(冠，0)或(o，N2)上。因此，这种策略具有风
险性。
3)互补均衡
互补均衡的性质在于，两个区域的经济发展处于一种共生状态。一个区域的经
济增长对另一区域具有正的效应，国际及区域贸易是这～关系的典型。如果双方互
补均衡不存在内部磨擦时，区域之间便会爆发式地增长。显然，～个互补的分工交
换经济是满足合作博弈的可加性条件的。但是，在后面的分析中我们将会看到，由
于经济体的非均匀性质，经济交换之间的合作、自给自足和相互竞争往往共存于一
个经济体系中。
当然区域经济关系依上面变量不同，还可能出现各种均衡性质。但以上三种是
最基本的a下表给出了不同区域关系下的各个区域的均衡支付，如表(4．1)。
表4-l两个区域的不同选择与支付
表(4—1)中的第一列和第一行分别代表区域1和区域2的策略选择。参与人集是
虚拟的，它们分别代表两个互动区域l和2。表中的系数分别代表着区域的政策参
数，它就是所谓的财政税收、金融及社会政策，这些政策构成了区域政策执行主体
策略集合。不同策略下的支付列于表中，它代表博弈双方的策略均衡集。从上表可
以看出，不同策略下的均衡结果将导致不同区域参与人的理性预期，从而决定了他
们的策略理性选择。下面我们依托上表的结果来推断各个区域的行为。
4．4．2区域“囚徒困境”
从上面的表中我们可以看出，经济明显存在着多种均衡状态。这些状态完全取
决于几个系数之间的调节。作为一个具有经济理性的区域政府，它有动力也有能力
对这些系数进行策略性地操纵。因此我们把反映相互作用的系数看作是区域政府的
策略空间。各个策略的支付如下，如果所有区域都实行封闭的策略，其收益为自给
自足解；如果所有区域都采用合作的策略，互补或合作解为(岩晶笋，％茅)；处于中
间状态的是(冠，o)或(0，厩)，它是不对称策略下的均衡解。根据博弈理论，
该对策的纳什均衡解是(N1，N2)，即区域都走向自我保护。这是一个典型的区域
“囚徒困境”，因为个人策略的最优化导致了整体的福利损失。而纳什均衡策略
(合作)虽然也是最优的，但不是风险最优的。因此，互补均衡解要么不能实现，
一华中科技大学博士学位．论文
2222222222222；=====≈===========2一：=；：：=
要么需要经常的维护。
4．5联盟行为与“囚徒困境”的缓解
我们假设，区域政府关心区域经济利益，而市场则关心个人或企业的利益。如
果把市场看作是一个大群体博弈过程，那么他们将会在不同水平上选择结盟、合
作。结盟后，个人或联盟收益目标往往会与政府目标发生冲突，因此政府目标可能
得不到完全的执行。上面的分析是把熬个区域抽象为一个主体来进行分析的，完全
没有考虑个人理性、集团行为对区域策略选择的影响。下面我们将从联盟博弈角度
来进行分析。
4．5．1区域联盟形成的条件
区域内各参与人选择结盟行为是有条件的。其中区域联盟利益、个人收益、成
本和个人势力将决定联盟是否会起作用。
设x，为各个参与人在区域结盟时的预期支付，v(s)为个人在某特定区域内的预
期收益，v(f)为个人的保留收益；c(f)，c(s)分别为在不同区域联盟中发生的费用，
它可能是税收、摊派、生活支出、交易成本等，这些支出最终都会转化为成本统一
核算到自己的会计帐户下。那么，个人区域理性选择将受制以下几个条件：
1)帕累托优性，或联盟理性条件(CoalitionaUy rational condition)t40】：
Σ‘≥V(j)。
Jej
当区域结盟会改进区域总体收益时，策略理性将导致行为人去探索它。从上面
的区域增长方程可以看出，一个区域的经济增长与现有资源存量成正比，因此参与
人不管以任何身份加入，都会从消费、资源上增加该区域的经济潜力。当然，当区
域出现了内部拥挤时，联盟边界应该停止增长。
21个人理性条件或参与条件(Individual Rational Condition or Individual
Participation Condition)：X．≥v(f)。
联盟收益最终都要分配到具体的参与人，是否改进了个人收益是参与人选择结
盟的标准，这就是个人理性条件。正是个人理性条件才导致了参与人在不同区域之
间的理性选择，从而决定了区域经济的不同绩效。在讨论个人理性条件时有两点需
要说明：～是个人理性条件或自由选择权必须得到保证。因为在一个投资、人才流
动和贸易高度管制环境下，经济处于非自由流动状态，这种制度性壁垒将严重改变
参与人的支付结构，从而不存在区域联盟的任何分析基础。另一方面，个人理性往
华中科技大学博士学位．论文
往会导致预期自强化、自实现特征。即，当个人一致预期导致了群体行为时，区域
经济会出现加速分化状态。我们见证过90年代中期的广东房地产泡沫现象，股市
追涨杀跌现象，也看到了区域的异常兴起现象。一个区域政府的成功政策主要还是
在于是否能够引导人们的预期协调。
3)交易成本约束
Σ工。一c(J)≥0
』tj
X』一c(f)≥0
当交易成本足以抵消结盟收益时，将会使结盟无效率；但是，如果确实存在一
种廉价的沟通机制，它大厦大节省了交易成本时，联盟就易于形成。我们经常会看
到一种矛盾的现象：区域政府为减小资源向本区域流动的成本费尽了心机，也为增
加流出成本而费尽心机。不过，在中国目前状况下，全国统一市场已经基本形成，
资源流动的制度性成本已经大大下降；区域之间的自然障碍也因政府对交通运输的
大量投资而得到部分改善；信息技术也有力的改变了区域之间的信息不完全状况。
这些措施都使区域之间的结盟更趋经济，因而我们发现了大量的资源跨区域流动现
象。不过，国际间的流动仍然存在巨大的障碍。
4)市场势力或讨价还价能力
参与人加入联盟的动机是，它既关心联盟的收益大小，更关心个人的最终支
付，因而联盟内部必须就如何分配进行谈判。设参与人的谈判势力为屈，i E s，，
则谈判函数为最大化广义纳什积(Kalai，1974，1977)⋯J：
腧c兀(一一V。)^，Σ^=V(s)，v(N—s)=0
lts ●‘J
这里的区域之间的结盟谈判是一个非常广泛的概念。这里的谈判即包括改变区
域游戏规则，也包括所谓“誓将去汝，适彼乐土”式的以足投票。
4．5．2区域策略执行及“囚徒困境”的缓解
设区域是由N={l，2，3⋯n)个人组成的。区域资源都通过产权途径分配到N个个
人手中，其中的公共品由政府所有。每个参与入都是一个最大最小化的经济入a那
么区域经济效果就由这N个局中人的策略选择来决定。为了简便，我们用三个层次
的执行主体来简化它。
1)大群体分散执行：cj=“1)，{2)，．．．{九))。即，每个人都独立行动，没有合作
也没有联盟。
2)区域整体执行：c：={1，2埘)。tip，区域是一个统一整体，所有人都像一个人
华中科技大学博士学位论文
一样行动，令行禁止。
3)联盟或利益集团执行：c；+c；+⋯+cⅣ_1。它代表着不同水平的策略联盟。
4．5．2．1区域整体执行
区域是一个抽象、综合概念，它事实上是众多行为主体的一种合成，因而我们
可以从联盟角度来进行考察，其行为及绩效也分别对应于不同执行主体下的支付。
一般来说，区域理性选择主要在两个主体层次上进行。一个是市场主体，二是
政府主体。从市场执行主体看，它是众多的厂商、个人(或家庭)策略选择的综
合，并根据个体收益状况进行区域之间的经济选择，因而他们的行为构成了区域经
济均衡的微观机制。区域市场主体包括生产商、投资商、资源所有者、人力资本所
有者等，这些主体具有较大的流动性，趋利避险，他们只关心自己利益而不关心区
域利益。由于区域资源流出会导致区域增长方程的极限潜力下降，因此它们的选择
行为对区域的影响将从两个方面产生影响(1)强化流入区域的经济增长，加速流
出区域的衰落过程； (2)削弱流出区域的经济增长速度及潜力。
与市场主体相对应的是区域政府。它并不象市场一样具有可流动性，因此它的
目标可以假定为是追求区域福利的最大化。从区域代理人一政府来看，区域的经济
增长关系到社会福利和个人福利，也关系到官员的声誉和职业前途，这使他们有动
力追求区域经济增长目标。加之政府有相当大的权力影响市场的资源配置活动，因
此它能成为一个区域理性选择角色。
把政府简化为一个合法参与人角色后，它就能够实质性地影响到表(4-1)中的
策略，因此它能够把一个分散的、抽象的区域整合为一个统一的区域，使区域就像
一个人单独行动一样。此时，我们可以适时地引入联盟或合作概念，即区域是一个
联盟或一个合作整体，以供后面分析。
市场和政府具有完全不同的策略选择倾向。作为区域中的市场主体，它一般倾
向于希望经济体系保持自由流动能力。这样一旦它的参与或激励条件得不到保障
时，它可以低成本的向其它区域流动。因而市场是推动区域不均衡的重要力量，它
需要一个开放环境，永远不选择自给自足策略。区域政府行为则比较复杂，作为区
域利益的代表，它将依客观条件相机选择策略。因而它可能选择自给自足，也可以
选择开放式的合作策略。从表(4．1)可以看出，如果对方选择开放，那么自己的最
优选择将是开放。但如果对方选择封闭，它的策略应该是选择对自己区域实行保护
政策。一般来说，越是具有优势的区域越不怕开放，而越是落后地区，越是趋向于
区域保护，即他们有一种趋于自给自足的趋势。
4．5．2．2分散执行或利益集团执行
区域经济是多个决策主体构成的，他们的许多决策函数存在诸多方面的不一
致。(1)各个行为主体的决策时间不一致。例如，区域是一个永恒的概念，但公司决
策只依从于法人的存续期，个人则关注生命周期内的收益，区域政府也存在行政周
期问题。如果他们的目标存在冲突，区域就很难作为统一的执行主体行事；(2)策
略空间不对称。客观上，区域经济的多重均衡性质扩大了执行主体的策略空间，它
们在有利于自己的支付均衡点选择策略。
每个参与人有两个基本备选策略：(1)当不满足个人或联盟参与条件时，它放弃
参与该游戏，流动到另～区域；(2)当所有条件都满足时，它继续留在该区域。
利益集团也一样。(1)当区域满足联盟形成条件时，它执行区域经济目标。显
然，这一条件导致肯定会引起区域的部门保护主义问题；(2)当联盟条件不再满足
时，利益集团会加速区域经济不均衡发展过程。假设利益集团是一个大型企业或区
域主导产业，它往往享受到很多区域优惠政策，因为它太大了；同时，它会经常
引起地方政府的担心，担心它流动后对本区域的灾难性后果，因而它可能操纵地方
政府，原因还是它太大了。
4．5．2．3潮流效应与不对称策略选择
由于区域是由个人和集团来执行的。那么只要达到联盟稳定与个人理性条件时
资源就能留在该区域，促进经济发展。而在分散决策下，即使达到了这一条件，仍
然有N．s的人不在联盟之中，由此不能保证u(Ⅳ一5)sU(vj)这一条件。其中U(vj)
为对立区域给参与人带来的预期效用水平，v，是预期收入。于是这部分人将向j区
流动，相应的是资本、人力资源、需求的外溢。结果既从产出又从需求上乘数式地
削弱了i区域的经济增长。
假设个人预期收益与区域增长成正比，那么由前面的区域经济增长方程可知，
区域流动将导致原区域的参与条件进一步修改，使区域流动倾向加剧。当流动累积
到一定程度后，就会出现偏向流入区域的潮流效应。这个雪球越滚越大，流出区域
的真正灾难开始了。因为政府如果去阻止资源流动，只能通过财政补贴、减免税
收、市场封锁等手段，使个人或联盟收益保持在参与条件上。而政府资源是受预算
约束，它只能重点保护。这导致不被保护的个体进一步流动。在这种情况下，发达
地区由于不怕竞争，它还会以更开放的姿势来强化人们的预期，而落后地区不仅不
能发展经济，还要背上保守的名声。
——3222华2222中2==科==；技===大===学===博====士===学==；位．论文
4．6区域经济关系的调节
从区域经济增长方程、相互作用方程、策略选择过程、博弈均衡解及联盟的条
件等都说明，区域经济之间的关系确实需要经常的调节和维护。否则区域之间的
“囚徒困境”可能性就不能被排除，整体的合作收益将不能实现。从上面的方程中
可以看出，引导区域向一个互补分工协作的经济体系转换，所涉及到的变量、参数
是足够的。要想成功的引导这一转变，可以从以下几个方面着手。
4．6．1改变区域之间的互动性质：即(Ⅳ，Ⅳ2)项调整
前面已经说过，该项反映的是区域之间的互强化性质，它也可以理解为各方相
遇的概率，或两个区域相互接触、交往、贸易的规模。
当该项取O时，区域之间是不相关的。此时，各个区域之间的经济增长规模分
别为自己资源潜力所约束，不能利用相互分工经济优势和比较优势；该项取负值代
表区域之间的相互竞争关系，取正值代表区域之间的各种互相强化关系。因此，只
有区域之间保持开放性、增加互补性才能有利于各方的共同成长，分享合作收益。
但是，正如前面分析的，在策略理性环境下，区域之间的自给自足是一个稳定的纳
什均衡解，因此，它并不能避免双方之间的磨擦。一个合理的经济秩序、建立比较
优势仍有必要。
4．6．2引入协调机制
区域经济增长有三个最基本的力量相互消长。一个是区域本身的增长方程。经
济增长理论认为，一个区域的经济增长是众多因素作用的结果：资源、技术、分
工、制度等，这些因素都是区域竞争力的增函数；第二种力量是潜在的增长力，它
推动区域经济增长并规定了区域增长的上限。当增长超过临介值后，区域经济将会
遇到重大的逆转力量；第三种力量是竞争力量。这三种力量的结果往往并不是确定
的，因此需要一种协调机制才能引导它们走向合作均衡状态。
区域经济中的协调主体有，一是区域政府之间的协调。在自由的市场经济交换
中，自动走向区域合作的机制主要有：通过双方之间的通讯过程、带合同博弈、引
入焦点仲裁和协调人或重复过程。因此，规范化的交流会使双方更易协调到合作均
衡上来。事实上，区域经济中的分散主体经常在发生这方面的交流，探索合作的途
径。这也是有些区域政府尽管还很保守，但仍然保持了频繁区域经济联系的原因。
现在我们在求把自发的合作上升到依法、整体互动层面上来。
二是通过焦点谈判来协调，例如上级政府的区域调节。这种调节既包括政策调
整、分散主体的预期引导、资源再分配过程，也包括减少资源流动的自然、市场和
政策壁垒，从而增加区域的开放性和减少成本。在西方许多国家中，上级政府协调
是通过建立正规的分税制度、转移支付制度和区域干预制度来实现有。因为中央税
收是上级政府成为一个权威协调人所必需的，它能够从整体上、长期角度防止区域
囚徒困境的出现，从而维持～个国家联盟的经济性。同时，政府有选择性地实施激
励和财政惩罚更加强化了自已社会计划者形象。但是许多国际性组织的协调目标则
难以实现，因为它缺乏必要的手段来强制或策略性地分配权利和义务。
4．6．3选择性激励
由于区域的微观执行主体是大量的市场参与者，他们的投资、贸易活动取决于
个体的成本、预期收益及风险。尽管区域优势多种多样：它有时来自自资源优势，
有时来自经济资源优势，也可能来自专业化优势。但这些优势只有通过市场途径才
能得到识别和认同。因此维持一个竞争互补的经济战略非常必要。既要竞争又要合
作互补，事实上是一个政策操作难度比较大的任务。下面，我们只从一般意义上来
分析。
在政策操作上，所谓竞争互补，就是让具有互补性的部门a。系数为正，同时
增加系数的数值。而对竞争性部门则使口。<0，或者尽是减少其数值。这样既可以
保持区域经济的竞争性，又能保持总体上的互补性。
政策操作的另一方面是减少合作的成本。合作的实现既取决于预期利益的激励
作用，也取决于实现它的难易程度。如果双方之间存在巨大的进入和退出障碍，不
管是自然的或是市场、政府壁垒，都将使合作的预期收益下降，抵消合作的效果。
自然障碍主要是空间距离、交易可实现性，它受制于交通、通讯等条件；而市场壁
垒主要是要保持结构上的可竞争性，防止区域垄断；政府壁垒则是制度设定的资源
流动障碍。
4．6．4适当促进区域的不均衡发展
一个区域需要建立自己的优势和竞争优势，但也未必完全是这样。现有的区域
联盟、生长极、城市化理论都肯定了不均衡过程的客观性，有时它也是非常的效率
的。因此政府应该积极地利用这些不均衡，来促进区域内部或区域之间的自强化机
制的形成，同时放弃一些竞争劣势的产业、改善区域布局方式。以便形成专业化分
工基础上的竞争优势和互补优势。
最后需要说明的是，某些地区的衰落是理所当然的，例如，我国的环境敏感地
40
华中科技大学博士学位．论文
区、无任何优势的落后地区。这些地区应该首先遵循自然地理分工规律和劳动地域
分工规律，促进而不是防止该地区的人口外流和产业外移，从而减轻环境压力。毕
竟经济不可能均衡地分布于所有区域。我们应该减少区域之间的市场流动障碍，促
进其开放性，允许市场自已来探索合理的区域分工结构。
4．7本章小结
现代区域经济关系的特征是，一是由于经济一体化的发展，区域之间始终存在
着相互作用。而相互作用的执行主体则是市场中的厂商、家庭和个人，他们的选择
与策略行为决定了区域经济的动力学过程和绩效。二是政府在不同层次上，以各种
手段调节着区域经济关系。但归根结底，决定区域经济表现的主导力量仍然是市场
力量。政府的干预是不可避免的，但必须仔细选择干预方式并且是建立在对经济互
动性质比较清楚的基础上。第三，建立区域之间互补的经济关系。这种互补就是引
导市场来探索各自的优势，并且互相利用对方的禀赋优势来建立自己的竞争优势，
而不是通过政府来进行资源再分配。国际上比较成熟的区域干预方式都证明了这一
点，例如美国在西部开发过程中，主要还是通过公共投资、土地产权激励来引导资
源流动的。其目的是在引导区域向合作均衡过度中，从成本和收益角度调整私人决
策的支付水平，而投资决策则由市场独立作出哗J。
华中科技大学博士学位．论文
5税收征管中的合谋行为
逃税(Tax Evasion)现象普遍发生。它由于造成公共资源来源不足、分配不
公、统计信息失真等不利影响，长期以来特别容易受到人们关注(郭庆旺等，
1996)143】。此外，作为影子经济的重要组成部分，它还能影响到宏观经济的波动
(蒋天文，1996)1441。对逃税行为的模型化，Sdnivasan(1973)t45l的预期所得最大模
型、Ailing,ham和satldmo一6J(1972)预期效用最大模型较为客观地识别出了影响逃税
的效应和因素。该模型的理论模式也是以后博弈论分析的基础，因为许多税收博弈
模型都直接沿用了该模型中的参与人假设和政策变量的取舍，这从任何一个税收监
督博弈模型都可以看出(张维迎，1997t471；阮家福t481，2001)
在税收征管系统中，最重要的问题是如何阻止诸多参与人之间的合谋与勾结问
题。目前的理论研究者都把注意力集中在诸如惩罚强度的调整、检查概率、改变博
弈信息结构等方面，且都是二人博弈局势。因为他们作了这样的基本假设：把博弈
参与人简化为征税方和纳税方，从而使问题可以简化到适于用标准的非合作博弈理
论的分析框架。以上简化虽然有助于分析税收机关和纳税人之间的关系，然而，当
我们在实际应用中却显得非常不自然。一是税收机关是一个多方参与的n人博弈问
题，简单的博弈分析掩盖了问题的复杂性质；二是即使我们可以把征纳双方简化为
二人博弈，征税方和纳税方都是一个庞大的群体，我们如何保证这些人只作为一个
统一的参与人?尤其是征税机关，它事实上是一个复杂的科层体系，同时又以一个
整体组织形态镶嵌政府科层之中。由于各主体的目标函数并不一致，信息也是高度
不对称的，从而会导致策略的不确定性。严重时它会沿着委托代理链条严重偏离初
始目标。
5．1税收征管博弈中的参与人
最简单的税收征管博弈中的参与人是征管机构和纳税方。“依法纳税”规定了
纳税人必须参与“游戏”，并按照法定游戏规则进行博弈。纳税人可选择“逃税”
和“不逃税”丽种策略，这两种策略又依存于税收机关的反应能力和策略：检查概
率和惩罚强度。由于税收机关面临着一个庞大的纳税主体，且本身受制于检查成本
的约束，因而在这种博弈中税收机关明显处于信息成本劣势。因此，税收机关必须
在多个变量之间进行权衡，确定经济的监管水平。从这个角度上看，税收博弈事实
上是一般的监督博弈模型在税收系统中的运用。其中，贺海涛(2001)在博士论文
华中科技大学博士学位论文
中的分析，是目前比较专业的文献。他扩展了我国税收征纳系统中的复杂参与人关
系，但未考虑合谋问题的解结构。本文试图虚拟一个多人税收博弈模型，来解决这
～问题。
本模型中的参与人有三类：税收征管人员、纳税群体和税收稽查机构。它们三
方都可能因具体的利益冲突而卷入进～场对策；当他们相互合作时，就会形成各种
利益联盟，此时博弈便转变为合作博弈；同时，每一类参与人事实上都是一个庞大
的分散群体，从而会使博弈扩展为非常复杂的局面。
假设征税人员有两种策略：诚实勤奋和偷懒索贿；而纳税人也有两种策略：诚
实纳税和行贿逃税。那么双方支付矩阵如下表(5．1)。在该博弈格局中，我们可以看
出，不仅双方合谋的收益总是高于不合谋收益，而且选择(偷懒索贿，行贿逃税)
总是超优策略。在这种情况下，我们再把征税人员假设为代表税收最大化的一方就
很不合理。因为选择<诚实勤奋，行贿逃税)是可以带来税收收入增加，但从个人
角度则不是最优的，现实中征纳双方的大量合谋行为也说明这种假定的不合理性。
表5-1征纳双方的支付
纳税人策略
收益
诚实纳税行贿逃税
诚实勤奋(0．O) (--5，5)
征税人偷懒索贿(5，一5) (10，10)
人们经常用“纳税遵从度”来分析纳税群体的纳税意识。事实上该概念已经超
出了传统的决策模式，而反映的正是征纳双方之间的对策关系。在传统的决策分析
框架中，总是假定征纳双方是一个决策关系。既给定纳税规模，征纳双方的共同目
标是纳税成本最小和税收收入最大化。显然，征纳双方的目标函数不一致时，由于
不同的联盟会赋予完全不同的支付水平，从而修改了参与人的参与条件和激励条
件，因而我们会预期到参与人成长和不同的结盟出现。在分析税收征管博弈时，我
们普遍有一个感觉，那就是中央与地方、地方政府与税收机关、税收机关内部人
员、检查机关等都是对策中的参与人，并且都有相应的能力和条件结盟。因此，结
盟应该是分析该问题的重要视角。
5．2结盟与结盟动机
假设税收博弈中参与人集合为N，N=(1，2，3⋯n)。它们分别代表着纳税
人、征收机关(虚拟参与人)、机关内部各个人员等。那么，该博弈不仅仅是像二
人博弈中的策略选择问题，我们必须考虑参与人选择结盟的自由。在上面的参与人
集中，理论结盟可以保持在许多层次上。例如，11人单独行动，二人合作联盟，三
人合作联盟等。在本例中，所谓联盟就是税收机关可以与纳税人合作、税收人员可
以与纳税人合作，或者三方合作。这样的联盟在理论上有2“一1，力=】，2，．．．iV个。可以
验证，当n=3时，联盟数为：(1，)(2)，(3)，(1，2)，n，3)，(2，3)，
(1，2，3)，一共是7个。
5．2．1税收系统联盟形成的动机
联盟形成的动机非常简单，即获得合谋或合作收益。参与人员是否选择结盟取
决于两个条件： (I)合作或合谋将带来联盟收益的增加。否则将不会产生额外的
收益进行个人收益函数的补偿： (2)个人理性条件，即每个参与人这所以选择结
盟必须使个人收入增加。只要符合这两个条件，我们可以预期在适当条件下这个联
盟是可能形成的。
在现实的税收体系中，由于税收监管和激励的不完全性，许多种联盟具有形成
的现实条件。监管的不完全是因为监管的信息成本过于昂贵，而对参与人迸行激励
又受到政策限制。例如，我们不可能过份不经济地分配监督资源(或税收征管成
本)去保证税收遵从度过到100％，我们又不能无限制的给予征收人员以激励，从
而购买他们的工作努力和诚实。这样在结盟收益的诱惑下就非常可能形成合谋关
系。表(5．2)是一个征收(1)、稽查(2)和纳税人(3)三方可能发生的各种支付
关系。
表5-2税收征管博弈中的联盟及收益
策略收益征收人员稽查人员纳税人
非合作(1) 工资收入
{2) 工资收入一
‘3) 一经济纳税额
合作(1,2)，工资收入工资收入真实纳税额
(3)
(1,3)，工资收入+合谋工资收入逃税收入一贿赂
<2) 收入
(2,3)，工资收入工资收入+贿赂逃税收入一贿赂
(1)
(1．2,3) 工资收入+贿赂工资收入+贿赂逃税收入一贿赂
华中科技大学博士学位．论文
我们将逐项来分析表(5—2)中的各项。表中第一项代表结盟或不结盟下各方的总
体收益，它可以分解为后面三项，分别代表着个人在博弈中的支付。显然，在非合
谋状态下，税收征管系统的人员只能得到工资收入，而纳税人按法定条款真实缴
纳。当然，这是一种理想的状况，它相当于三方按非合作博弈方式进行博弈。但
是，考虑合作状况时，情况可能要复杂一些。因为有多种联盟出现，我们必须分清
各个联盟的具体支付。如果征收人员与纳税人合谋，纳税人将不能上缴真实的税
款，但他必须给纳税人一笔贿赂。同时逃税是违法的，因此纳税人将面临着被稽查
出来的危险，它会相应要求一个风险补偿。补偿额相当于第三方获得的同等收入。
由于合谋能够导致征税和纳税双方的收益增加，因此结盟是满足以上所说的两
个条件的，显然收益构成了结盟动机。事实上，无论是在国外或是国内，不管国家
管理多么严格，这类合谋现象都会经常的在不同水平下发生(贺海涛，2001)，因
此它决不是偶然的。
5．2．2税收征纳联盟形成的有利条件
由于利益的确定性，税收系统中的博弈联盟具有很大程度的可预测性。但是，
能够预测到这种联盟的可能性并不代表该联盟就能够真正的形成。事实上，还有许
多条件限制了参与人结盟，并且可能因利益的代价问题使参与人自动放弃结盟行
为，因此许多不切实际的联盟将被排除掉。一个税收系统中的合谋联盟形成的条件
不外以下几种：
1)有效沟通。有效沟通是结盟的重要条件。能够进行有效沟通的情境包括熟
人关系、特殊群体(老乡、同学、血缘及其它)关系、长期接触等。此外，中介人
也有可能把各方协调到联盟合谋状态。显然，税收人员长期与纳税人交往会创造这
样的情境。
2)制度条件。制度事实上是通过调整个人支付来影响个人行为选择的。由于
任何个人都是更大参与人集的一部分，支付调整可以限制结盟。例如调整工资支
付、增加惩罚强度等都会使参与人从长期、总收益的得失来权衡是否选择合谋。例
如高薪养廉、勤查重罚等通行作法就是这样考虑的。
3)合谋成本。合谋需要经过通讯和协调过程才能实现。从发起、接触到创造
合作的条件及合作方案的实施，都会发生相应的支出，这些都是合作成本的一部
分。此外，从广义上说，心理成本、机会成本和可能的惩罚都应该包括进来。实现
这一交易的成本会限制合谋行为，阻止给定的收益机会。
4)参与人的时间贴现率。是否决定选择合谋完全取决于参与人的利益。而参
与人利益一般分布在一个较长的时间区间中。因此存在一个眼前利益与长远利益的
对比权衡问题·一般来说，对税收征管人员而言，在下列时间点上时间贴现率将接
近于最大，从而可能放弃过去的遵纪守法行为。这些时间点是：生命周期的后期、
职业生涯的后期(59岁现象)、职业转换期等。对于纳税人来说，不打算进行长期
交易的任何类型，如小企业、跳蚤市场等，时间贴现率比大企业、长期参与人时间
贴现率高。
5．3一个数值实例
5．3．1模型分析
假设一个征管系统是～个3人参与的对策局势，基本的参与人是表(5．3)中的三
方。合作可以带来合作收益，也会发生成本支出。这些成本包括请客送礼、方案策
划、给中介人信息费、作假帐等。同时，有一个虚拟的局中人如税收稽查机关、法
院等，它是专门用来阻止税收机关与纳税人之间合谋的。我们假定该参与人是通过
设定惩罚标准、奖励规则并调整检查概率(罚金栏)来调整双方行为。但是，作为
一个经济人，它也可能因利益关系而成为合谋中的一方。假设各方的合作预期收益
由正式给出：
E(u(s，V，C，d))=p(V(j)一c(s))+(1一p)(v0)一cO)一d(s))
式中：E0(s))为参与人的预期收益，J是参与人集N的子集，它代表各种可能的博
弈联盟。v(s)为形成联盟的预期收益，它必须从合作或合谋行为中产生；c(s)是联
盟形成的成本；d(s)为罚金，P为平均被查出的概率，这里我们假设它为常数。
显然，各方的平均收益由下面全微分(5-1)给出：
d(E(”))=等譬一警軎一(1一p)等等(5-1)
也就是说，参与人的行为选择与收益、成本和罚金相关。当然，当检查概率
是可调整变量时，它与检查概率负相关。
为了简化分析，我们用表(5-3)中的模拟数据来对上式进行说明。在表(5．
3)中，设定的P=10％，罚金为负可理解为给予的奖励。当预期收益为正时，我们
认为联盟是可能的，在最后一列中用(+)号标出；预期收益为负时，用(一)号
标出，代表该联盟不会形成。
华中科技大学博士学位．论文
表5-3联盟支付
可能结盟形态收益结盟成本罚金预期收益可能结盟
{1}，{2)，{3) 0 0 —30 30 +
(1。2) 35 5 600 —30
(1．3) 150 30 200 100 +
(2，3) 100 80 250 —5
{1，2，3) 300 50 475 0
从上表可以看出，合谋总是有条件的。在许多情况给定的情况下，一些联盟尽
管具有正的收益结构，但结盟的成本、政府管理策略会限制它的形成，因而在实际
中可以排除一些不切实际的联盟，从而减小了我们对可能联盟的关注范围。这样，
我们就可以把重点确定在不能排除的联盟上。例如，在现有制度框架内联盟(1，3)
是不能有效排除的。而对联盟n，2)， (1，2，3)来说，尽管结盟存在较大的合作收
益，但客观条件限制了它的形成。
S．3．2税收联盟博弈的政策意义
由于联盟博弈理论考虑到了现实中的实际情况，因而它Lk_-人博弈的分析更具
有现实意义，它应该是税收征管博弈的一个真实分析框架。从上面的分析看出，分
析税收系统n人博弈中的联盟行为的意义主要表现在以下几个方面：
11预测可能的勾结合谋行为，确定可能的联盟
联盟之所以形成，一是合作的收益将诱导参与人之间进行结盟。二是一些条件
将使其以最低成本进行结盟。在二人博弈中，我们仅仅分析纳税人与征税方之间的
博弈。但许多分析者都认为这太过于简化，从而使博弈论运用不自然。事实上，在
税收犯罪中往往是相关的多种类型人员的参与，即它是一个n人博弈过程a当然，
当我们只讨论二人博弈行为时，它是n人博弈的子集，这个子集有c：=墨笋个。
一旦确定了可能的联盟及形成条件，我们就可以在制度上加以防止。例如，过
去我国征税、稽查不分家的时候，征纳双方就非常容易形成一个合作的联盟逃税。
但当稽查和征税方分离以后，结盟的成本就大大上升，从而在一定程度上可以阻止
联盟的形成。
2、对合谋勾结的防止：制度设计问题
联盟博弈的意义之二是，如何重新设定游戏规则，破坏联盟形成的条件。尽管
合谋形成的条件多种多样，但最终都可以归结为三条，一是结盟的利益大于不结盟
收益，这被称为联盟理性；二是个人加入联盟必须保证收益上升，这被称为个人理
性；三是有～种廉价的途径使某些联盟易于形成。因此任何增加结盟成本，调整联
盟的收益和个人收益的政策措施，都会影响到参与人的行为选择。防止合谋结盟正
是要从以上三个方面来斩断他们之间的消极联系。
增加税收系统内部结盟的成本联盟形成的条件是它们能以较低的成本探索
(廉价勾通)到最佳联盟。如果我们能从制度上增加合谋结盟的交易费用，我们就
能减少可能的合谋机会，这正如上面案例所揭示的。
有许多种增加联盟成本的方式，如“回避制度”、“职业轮换制”、“征收与
管理分离”等。回避制度是中国沿用已久的古老制度，它假定特殊的社会群体更容
易沟通，从而导致合谋，回避制度则会增加沟通上的障碍；职业调动也具有类似的
功能，因为博弈论认为：长期博弈会导致合谋行为。征管分离则是为了防止更大规
模的合谋，同时使纳税人合谋成本上升。
调整参与各方的支付水平创造参与人之间的沟通障碍是阻止联盟形成的条件
之一。但是，对于巨大的收益机会来说，成本一般都不足以影响人们的结盟行为。
因此，调节行为人的支付结构就非常重要。以下三个方面进行支付调整都可以减少
形成联盟的收益：一是改变个人支付。例如，在表(5．1)中给予各方10(d=一10)
元的激励，就可以阻止(1,2)联盟的形成，但却不能阻止(2，3)结盟。这可以这
样来理解，由于前者带来较小的联盟收益，而后者则有更大的激励结盟。在现实中
我们也可以看到，高薪往往作为一种激励税收人员提供诚实、勤奋的公共服务，同
时也提高了该职业的机会成本。但是，当高薪与巨大的合谋利益诱惑相比微不足道
时，仍然难以纠正税收人员的违法和纳税人逃税行为。所以说，高薪可以阻止一些
常规犯罪行为，但不能防止暴利诱惑。二是结盟成本的调整。在上面的数值实例
中，联盟(2，3)会有100单位的合作收益。但是结盟成本限制了结盟行为，相比之
下(1，3)能以低成本结盟。三是犯罪概率与惩罚。在一般文献中都认为提高检查概
率和罚金有利于消除合谋行为。
3)确定联盟形成中的关键人
虽然联盟是多人参与的行为，但个人在结盟中的动机及重要性是最引人注目的
问题。某些人在联盟中起着重要作用，这个人被称为关键人。由于关键人一般要求
获得与自己势力相对称的收益，所以它最有动力作为联盟的发起人进行结盟。以税
收犯罪为例，有时是纳税人主动行贿，有时是稽查人员索贿，有时则是征收人员索
华中科技大学博士学位论文
贿，此时他们分别充当着联盟发起人的角色。如果我们能够以最经济的方式侦察到
现有制度安排中的关键人，那么我们就完全不必要对联盟内所有人进行关注。因
为，在一个合作网络中，当我们斩断了关键人与其它人之间的联接，事实上就已经
阻止了联盟的形成，这将使我们的监督成本大大下降并能集中注意到较少的参与
人，监督资源的使用效率也将大大上升。
在实际分析中，我们用D(J)来反映联盟s的价值，它是各个可能的合作或合谋
带来的收益。这样，表(5．3)中各个合作联盟的增益为：
u(1)=u(2)=u(3)=0
o(12)=v02)一v(1)一v(2)=35
v(13)=v(13)一vO)一v(3)=150
0(23)=100
0023)=300
Shapley假定每个参与人在结盟中的势力或贡献是不一样的，如果把各个人对
联盟的贡献计算出来，也就找出了联盟中的关键人，政府也就能够确定问题的关
键。各个参与人的势力值为：谚=Σ半，
他们对联盟的增益为：v(s)一v(s＼i)>-0，于是各个成员对训个联盟带来的平均增益
是其加权和。铲Σ坚掣(v(沪小＼f))
x．2导u(1)+等u【(12)一u(2)】+等[u(13)一u(3)】+等[o(123)-0(23)】=97．5
X2=72．5
X3=130
因此，在上面的数值实例中反映出，三方合作收益非常明显。如果政府想从支
付上来调整三方参与人的行为，那么调整纳税人将是最关键的(130)，因此它最
有动力作为结盟的发起人去与其它各方结盟。如果我们要防止结盟行为，设定惩罚
额，对纳税人来说应不低于130，稽查人员不低于72．5，征税人员不低于97．5；或
者使他们结盟的交易成本达到同样的数额。此时完全可以阻止联盟的行成。
4)组织监督和激励
在税收系统中，大量的税收管理(包括征收、稽查人员在内)都是以组织形式
存在的。例如，一个税收管理人员总是隶属于某一局、处、所。相应的，对纳税人
来说，我们总是倾向于将其分为几个类别。这样就通过管理途径将分散的参与人进
华中科技大学博士学位．论文
行组织化了。税收征管人员不仅受到法律的严格约束，而且通过组织途径分配了责
任兢刚，并经常的处于组织约束之下。当组织内部管理非常严格时，下级的税收管
理久员将会嚣含谋、结箍受裂缝织肉静惩弱。奁极端情况下，我们W戳将整个组织
看作是一个参与人。这对，税收系统蛉赝鸯人员将被篾饯为一令参舄人。或卷我髓
说，他们是一个最大的联盟。但是，当组织约束非常松散时，由于被惩罚的概率下
降、监督的无效率，会导致爆发式的合谋犯罪行为。因此，阻庄合谋的重要任务之
一是强纯缝绥内酌驻督功能。
对于纳税群体，也痰该避进设诗繁毒鱼我激励性质豹监督撄弈楗裁，缩小捡焱
范围，使监督保持在经济高效的水平。一种分类检查机制可能是较好的方法，这种
方法在银行、顾客管理等许多领域都脊成功的运用。它的原理是通过对篥些特征的
纳税久群进行特{歪提取，校掘不黼静遗法穰率设计不同豹检查窳平，分配不两的鼗
管资源。这样就娩避牙羹点她针慰某些特殊纳我入进孬穆莲，增嬲葵纳裁成本，镪
括心理成本、时间损失、信誉惩罚、增加检查概率、加大惩罚金额等。
6 n一人博弈与结盟行为
——中国医疗系统的行为扭曲过程分析
中国医疗系统的行为非常诡异。如医生对服务变量的任意操纵、药品商与医院
医生的合谋等，从而不仅扭曲了医疗行为而且推动医疗费用不合理攀升。为了改变
现状，政府不断的修改游戏规则，企图修正各方的行为。这些手段包括：1)通过
引入竞争来改变市场结构，如公开招标制、医院内部竞争。2)调整支付结构，如
把药品收入上缴财政；3)斩断合谋形成的某些廉价对话机制，如医药分离经营。
4)引入阻止联盟，削弱医生和医院的市场势力等。还有人认为，医院委托人缺位
导致组织目标不能得到维护，作为内部代理人以低价执行个人目标，因此医疗问题
应该从产权问题上着手。
医疗服务行为扭曲首先体现在费用的不合理攀升上，这本身是一个世界性难
题。从世界医疗服务的供给模式可以看出，无论是按服务收费、社会化医疗体系、
分散化国家卫生服务还是社会主义医疗模式，都存在着质量与费用的冲突
(Field，1989)1481。个中原因极其复杂，在客观上，健康文化、行政费用上涨
(Woolhander,Himmelsteirl&Lewontin。1993)1491、通货膨胀、技术革新(William
Rushing,1984)Lsol，第三方付费制度(John Knowls,1973)【5l】都是主要原因。而医药
合谋、欺诈等行为虽然也在发达国家的医疗服务中出现，但由于政府严格管制
(Start，1982)【锄、保险机构等有组织的专业谈判能力和消费者主权意识而得到缓解
(Hafferly&Light，1995)／53／。
医疗系统行为扭曲总是不同程度的存在，但在某些特殊体制背景下格外严重。
纵观世界医疗服务的行为纠正方式，成功的方式体现在几个方面：一是通过行为激
励与约束机制来修正；从激励方面来看：医生的收入在发达国家一直都是很高的；
政府购买一直也占大比重，从而保持了医生和医院收入稳定性；从约束方面来看，
政府对医生实行严格许可证管理，医院的产业进入壁垒也相当高，这使他们的违规
机会成本相当高。同时，政府对产业的管制比较严格，其中药品推销员的角色主要
定义为是向医生和病人展示新药品信息(MoGettigan，2001)州，而对药品商与医
生的交往也有严格的限制(Waz．衄a A，2000；Richard Day，1999，2000)155J)WHO
(World Heath Organization)还向相关国家推荐了适用于药品推销的职业道德标准
(Richard Day．2000)1561，以便构建行业自我约束机制来补充其它方面的不足。二
华中科技大学博士学位论文
是充分考虑了市场中的谈判势力，在市场中引入势均力敌的参与人来削弱医疗方势
力，从而使市场结构更具竞争性。由于医疗服务特殊性，消费者的服从性、专业障
碍和分散性，从而使消费者不具有市场势力。因而都主张引入更强硬的谈判对手：
政府、消费者协会、保险机构，从而改变了博弈中的市场势力。第三，从产权和治
理结构上看，除了私人开业医院外，世界医疗卫生服务组织的发展趋势是：传统的
单独行医、自我雇佣和按服务收费的行医行为模式逐渐向公司化有组织的模式转
化，医生也逐渐成为雇佣医生(Phillips Kletke，david Emmons&kurt Gillis，1996)
【5”。现代公司的复杂监督机制及对自身存亡的关注使之不会放任医生的行为。
医疗费用攀升与行为扭曲客观上来源于医疗市场上的结构、信息等原因，它是
政府失灵和市场失灵的特殊表现。国外许多研究都把研究重点放在合谋行为上
(Avom et al，1982，1987；Poulsen，1992t硎；Fred Charata,2001)，但是这些研究大多
只注重现象研究，且一般只在二人博弈环境下。由于医药合谋是许多部门及关键人
相互作用的过程，期间既存在合谋又存在利益冲突，它是一个多参与人的博弈过
程。因而非常适合用多人博弈模式来进行分析。在本文中，“医院”则被定义为一
个n一人合作结梅。在此基础上利用合作博弈联盟理论来分析了医疗系统的行为扭
曲的逻辑过程。本文重点说明了两个问题；一是正式组织的稳定性条件及非正式组
织(医药联盟)何以能形成。二是医院和医生如何演变为药品经销商及推销员这一
过程的。
6．1 11-人博弈中的联盟行为
6．1．1联盟数量与特征
给定经济机会v和参与人数N，局中人会从两个层次进行选择：一是参与人的
策略理性导致内部形成联盟。～个2人以上的n人博弈问题必然涉及到联盟博弈
(myerson，1991)Is91；二是联盟内部的讨价还价问题，这一过程的结果是把联盟收
益分配到各个参与人(1ucasl983)。
当N人独立行动时，它是一个n人讨价还价问题，此时极有可能陷入n人“囚
徒困境”。然而。如果局中人能进行局前通讯(Aumann’1974)唧、引入协调仲裁
(myerSon，1991)t6”、长期互动(Axelord，R．1980，1981，1984，)162l或者存在廉价对话机制
(Farrell 1987，Crawford，1998)[631，他们就能以较低的交易费用协调到更好支付
的“焦点均衡”上(Schelling，1960；Farrel，1988，myerson，1989)删，从而使有利联
盟成为事实。’
华中科技大学博士学位．论文
从经济理性出发，参与人会探索出最经济的利益联盟。所谓利益联盟是指相互
通讯的局中人为赢得合作、合谋收益而形成的团体、组织，这种组织可能是2人结
盟，3人结盟，理论上一个N人组织可能存在2”一珂一1种二人以上的内部联盟；所谓
经济性是指一个联盟随着规模的成长，得到的收益也上升，至Ⅱ一定规模时它必须停
止。此时，该联盟将得到全部经济收益v(s)，而不在联盟中的参与人得到0支付或
保留支付，既v(s)卜0，v(N—J)=0。所以，联盟的边界由以下条件决定：
v(s)>_0 v白一s)：0，型>o，塑罂-<0 锄aH‘
联盟具有以上成长特征，一是某些内在技术、经济原因决定的，例如专业化协
作生产附加的某些限制。一个医生要想提供医疗服务，必须与资本方合作，获得服
务设备，同时与护士合作。如果三方不能结合，都将失去赢利机会。二是联盟之间
的利益冲突，相互威胁能力(Nash,1953)、谈判势力(Shaply，1972)等，可能把更
多局中人引入联盟，推动联盟规模成长。例如，按效率原则医生、护士和资本方足
以形成一个经济联盟，但如果政府具有阻止该联盟独立获取支付的能力，则要求任
何一个联盟必须纳入它。
6．1．2联盟形成的条件
联盟行为是有条件的。其中联盟利益、个人收益、成本和个人在联盟中的势力
决定了可能的联盟是否会结成起作用的联盟。设x．结盟时实际支付，v(s)为联盟收
益，v(f)为个人保留收益，c(i)，c(s)分别为结盟中个人承担费用和总成本，那么：
1)帕累托优性，或联盟理性条件(coalitionaIly rational condition)：Σx，≥V(J)。
Itj
既当结盟会改进团体收益时，策略理性导致行为人去探索它。
2)个人理性条件或参与条件(Individual rational condition Or individual
participation condition)：x。≥VO)。
联盟收益最终都要分配到具体的参与人，是否改进了个人收益是参与人选择结
盟或如何结盟的标准。
3)交易成本约束。
Σx。一c(s)2 0
』‘j
工．一C(f)≥0
当交易成本足以抵消结盟或个人收益时，将会使结盟无效率；但如果有一种廉
价的沟通机制，节省了交易成本时，联盟就易于形成。
华中科技大学博士学位．论文
4)市场势力或讨价还价能力。
参与人加入联盟的动机是，它既关心联盟的收益大小，也关心个人的最终支
付，因而联盟内部必须就如何分配进行谈判。设参与人的谈判势力为卢，，i∈s，，
则谈判函数为最大化广义纳什积(Kalai．1974．1977)【65，66J：
MaxFI(x，--V，)届，Σ工．=V(J)，v(N—J)=0
lEl lES
上式的意义是： (1)只有s个人共同参与才能获得经济机会，如果任何一个人
脱离该组织，乘积形式意味着联盟解体，参与人都得到0支付； (2)参与人选择
加入联盟，它必须得到高于q的收益，这就是个人“理性条件”或“参与条件”；
(3)当联盟收益取决于个人努力和势力时，公平及效率标准(Nash,1950．19531叫)
要求在收益中反映这种努力水平和势力； (4)谈判中的地位往往并不对称。这种
不对称有复杂的来源：如权力(1ucas，1982)t681、对联盟的边际贡献
(meyerson，1989)，甚至是文化、制度等背景差异(David Sally 2000)t691，而经济分析
往往是对势力的一种不完全度量。
6．2作为联盟形式的“医院”
6．2．1“医院”规模选择
首先我们从结盟角度来定义一个“医院”，它是参与人自由结盟、博弈的结
果。参与人有政府(G)：资本(Cm)，m代表具备医院所需最低资本规模的所有资
本家集合：医生(D．)和管理者M，集合。给定经济机会v，现在让参与者之间进
行自由结盟，那么可能存在以下几种形式的“医院”：
1)资本效率准则：在该准则下，资本所有者负责与局中人谈判及签订合同。
政府保留最低的干预水平：其它局中人都保持在边际规模上，即，
％=％’_％=0。不会出现“冗员”也不会出现“医院”规模过小问题。
2)技术规模准则：该准则保证医院足以提供团体医疗服务。这个规模在以下
条件下可自由调整：只提供专家咨询的私人诊所可以单人形成联盟；小型医院需要
一定资本投入和其它的辅助设备、人员。这些联盟具有以下形式：
v(D，C)>-O，v(G)=v(M)=0。既医生与资本家结盟，管理者与政府分配为O；
v(D，C，M)>-0，v(G)=0。医生、管理者和资本家结盟，政府支付为O：
v(D)卜O，v(N—D)=0，此时是一个典型的服务咨询医生。
3)管理者原则：管理者结盟的目标比较复杂，委托人收益最大化是其目标之
一；同时，管理者又是实际的企业内部人(委托人)，它专于谈判及合同的设计与
监督；代理风险导致经理可能偏离管理者目标，为满足个人目标把参与人数扩大到
非经济程度，且在内部结盟(内部人控制)。
4)政府进入：目前中国医疗产业结盟的现实是，任何一个医院都必须把政府
加以考虑。既：包含政府的联盟才能获得支付，否则支付为0。即：
v(G，D，C)=v(G，D)=v(G，D，C，M)=v(G，M，D)卜O，v(N—G)=0
从上面分析清楚表明， “医院”的结盟规模明显受制于制度和参与人数。也受
制于技术、经济效率方面的约束。
6．2．2联盟中各参与人的势力
由于现实中只有一个政府G，众多的资本所有者、管理者和合格执业医师，让
我们来分析实际的联盟势力：
1)假设只有一个资本所有者、管理者和医生，意味着都是垄断参与人。势力
为：伊=({，{，{)
2)如果市场中的合格管理者是m个，随着管理者人数上升，它将逐渐丧失势
力，最终变为可怜的“哑元”；同样，医生、资本所有者参与人数上升也会遭受同
样命运。
3)如果政府既是一个独立参与人，同时又是企业资本所有者(如国有企业)
时，它的势力会迅速上升。由于按照现代企业制度，所有者产生管理者，政府、管
理者和资本所有者合为一人。此时“医院联盟”变成了无限加权对策。在这种对策
中，其极限过程是政府具有完全势力(Shaply．Shapiro，1967po]，Aumannl974，
Millnor．1978t71】)。
4)如果政府方面不存在“道德风险”且赢利是唯一目标，它会像一个真正的企
业一样行动。如果政府对多重目标实行代理制，代理风险不容忽视。
即参与人的“市场结构”决定了参与人的势力。
6．3内部讨价还价与医院“主权”的丧失
结盟能赢得更好支付，从而使联盟具有价值。但两个重要条件决定了联盟能否
获得支付。首先是n人讨价还价结局(或解结构)。由于机会损失和昂贵的谈判费
用，最终谈判必须停止(Meyerson，1991，Selton，1988)[721。现实中的医院最终停止
于这样一种形式：由政府势力派生的焦点仲裁人角色使之成为委托人，分别与其它
方签约a这使需要谈判次数由2”变为由一个企业所有者与各个局中人谈判，这个次
数为n-1次，交易费用和时间机会成本大大下降。
如果政府不参与，此时：v(D，A，M)=max{O，f(D，A，M)，
既资本、管理者和医生将结盟，按最大最小化方式选择医院形式、规模和分配
方式。此时，医院的目标是通过提供优良服务获得收益。这样，在n人博弈联盟中
就内生性地引入了一个委托人，它负责内部的监督和激励并获得剩余索取权。假设
医生服务水平在(一。o，疗)时，医院对医生实施数额为c∽)的罚金；而对参与人服
务水平处于(，『，m)之间时，医院将用合同形式向医生支付s∽，)的利润；
厂(曩)，厂(疗：)是两种服务质量的概率。委托人与代理人的目标是使各自预期收入最
大化，即，医生通过权衡激励和监督对自己收益的变化来选择服务水平，而医院则
通过医生的选择来执行自身最大化目标。这一目标是在医生服务变量中设定一个触
发机制，自动启动惩罚和奖励。并且可以通过一个合同合并执行如下：
医院：inal：f：“(c(石I))，(而)如l+[”(石2-s(Tr2)肌石2)咖2
f- 柚．
医生：m虹{Lu(-c(x))f(irI)妇l，[Ⅳ(s(石2Ⅳ(It2)如2}
但是，政府介入将会使以上的一切陷入困境。(1)参与人谈判势力的丧失使它
无法控制结盟的规模，把许多不相关人员纳入组织之中；(2)政府势力和代表效率
方的势力讨价还价结果是分配平均化，激励不足是必然结果：(3)剩余索取权的丧
失导致监督动力的丧失，同时激励合同不再具有合法性。因为激励是从剩余中转移
的，这部分收益并不归医院方所有；(4)监督和激励丧失必然导致医生放弃执行联
盟目标，转而依靠联盟价值来最大化个人收益目标。
6．4参与人的理性响应及行为扭曲过程
在联盟中失去谈判势力的其它参与人并不会就此罢休。(1)医生具备完全一
级价格歧视的所有条件；高度信息不对称、作为专家服务产品识别困难、结果的不
确定性、广泛的替代变量、消费者需求缺乏弹性等，都能使医生在与病人长期接触
中探索到消费者的预算约束和需求曲线，从而合法操纵服务变量占有消费者剩余。
(2)政府拥有的否决权是制度设定的结盟条件，国有资本进入进一步从企业制度
上强化了政府的合法势力，结果使医生、管理者和市场资本失去势力。(3)政府
是一个抽象的参与人，它的目标只能实行代理制。在信息不对称环境下，监督和激
华中科技大学博士学位论文
励都存在着许多限制，代理风险不可避免。于是处于代理人状态的医生和管理者可
以在以下策略下作出反应。
6．4．1以足投票
按照前面分析，参与条件(个人理性条件)赋予其它局中人一个“选择权”：
当医院不能为其提供边际工资时，它可以放弃结盟。但是，由于在中国情况下，医
生面临以下困境。(1)能提供全面、高质量的医院基本上都不能回避政府和政府
资本，激励问题程度不同的表现在所有医院： (2)由前面分析可知，医生根本不
具备结盟势力。(3)联盟条件已经说明，Ks)>_0，vCN—s)=0，既只有联盟获得全
部支付。这种支付大多由垄断租金组成，其次才是竞争性服务收入。而参与人只有
结盟才能参与分配，脱离联盟支付为0，医生最好还是首先保留在联盟中。“以足
投票”不是理性选择。
6．4．2重新结盟一私人诊所
目前的私人诊所可以看作是在更小规模上的联盟行为。这种联盟排除了政府势
力介入，组成了一个非常有效的服务组织。在美国、加拿大及日本等市场经济国
家，医生私人开业及按服务收费都相当普遍。但在中国，这些组织一般具有非常特
殊的顾客特征： (1)从目前广告信息来判断，私人医院80％属于“性病”等社会
歧视性病种： (2)一些无力入院治疗或被确诊无望而“碰运气”群体； (3)自费
医疗、低收入群体。显然，对大部分医生来说，也不是一个理性选择。
6．4．3服务努力调整、风险操纵及内部人控制
处于代理状态的行政权威成为医院内部控制人，操纵内部管理资源的配置：而
对保留在正式组织中的医生来说，医生可以选择另外几种“投票”方式： (1)选
择自己努力变量。由于医生选择努力的监督成本非常昂贵，行动不可观测和结果不
可观测，“偷懒”是理性策略之一。(2)风险操纵。从上世纪80年代后期，贿赂医
生(“送红包”)现象已经相当普遍，尤其是对于风险高、疗效不确定性大的医疗
服务(手术最为普遍)。贿赂的性质主要是激励医生提供诚实的服务，从而排除道
德风险。(3)在正式组织内(进入合法联盟)重新结盟，为非正式组织服务。
6．5联盟的进一步探索一非正式组织的介入
上世纪末，药品经销商跨过一般的商业渠道，广泛的渗入医院，作为一个联盟
的发起人直接在医院内部结盟。这个联盟是有效的， (1)它是一种“帕累托”改
进；联盟规模达到了边际水平，参与人支付都得到了改进； (2)创造了一个很好
的沟通机制，从而它象一个正式组织的协调人一样管理医院； (3)参与人的势力
得到了经济上的表达：医生、医院都兑变成了药品经销商。
6．5．1局中人的通讯与联系过程
在医药代表的协调下，医院内部形成了两套机制，一套是作为企业的医院，它
由一个由医院内部的行政与业务关系组成的管理体制，成为正式组织：另一套是非
正式的组织系统或称“影子医院”，它由医药代表所操纵。
1)医疗代表的巡回路径
医疗代表通过两条主要路径渗入医疗系统。～条是是为了取得药品经销权，它
被医药代表称之为“开医院”。只有通过了这一谈判它才能进入下一谈判程序。在
这个讨价还价小联盟中，药剂科和药事委员会都有否决权。
另一条路径是临床医生。医生拥有处方权，因而他维持着对用药的品种选择、
数量调节的势力，它可以操纵这些变量。所有与临床相关的品种和数量选择都与处
方相关，它具有数量调节的特征。因而医疗代表称之为“作临床或开临床”。
此外，医药代表还必须保持与以下部门的经常沟通：采购员、财务部门、库管
房和门诊药房。这些部门在决定采购批量、资金调拨、相关品种选择等方面具有势
力。
医药代表要想驾驭一个网络，必须依托良好的信息沟通体制，尤其是对医生的
激励。“药房”在这方面充当了重要角色。由于“处方”是专家的信息服务产品，
当患者不接受推荐的服务方案或者到药店购药时，就会导致医药代表对医生的“推
销努力”难以计量。为了防止“偷懒”，医药代表可以通过药房统计到相关信息，
从而维持了有效激励。此外，药房还对竞争对手、替代产品及其广泛的药品结构信
息泄露出来。当然信息不是免费的。
2)医疗代表的激励与协调
“货币”是医疗代表的协调工具。医药代表要想成功地完成使命，需过四关并
发生三种主要费用(四关三费)。即医药委员会关，药剂科，采购、货管和财务
关。医生关；三种费用是开户费(固定经营权)，临床费和维护费用。就是如此简
单的几个管理合约。
58
6．5．2极小取胜联盟
医药代表要协调整个网络关系，但必须确定重点。为了勾画这一过程，我们用
网络联系图来进行描述(图一)。在众多局中人构成的联系网络中，医药代表只关
注最重要的几条，即如何使药品销售最大化。而销售取决于与医生，因此在下面的
网络中，只要确定出医药代表到医生之间的关键线路既可。图中，带箭头的联线表
示关键勾通方向。‘表示连线之间的潜在合同关系。医药代表必须和所有局中线路
讨价，但重点将放在最短线路上。
从网络图中得出相应的各成员之间的联系矩阵为：
c=(c玎)6x6=
0—0 0
0 O O O
0 x2 0黾
0 0 x，0
O 0 O丘
0 x7堍x9
图6-l非正式组织联通网络
于是有：(c)(1l=(O，一，0,0，％，氏)
(c2){1)=(c)(I)·c=(O，x627，工zx8，z4x5+x6南，x5工lo)
‰O屯b‰O
屯o
O
h
O‰
把(c1)(1)，(c2)(1)，(c3)(1)，(c4)(1)，(c5)【1)中的第二个元素全部挑选出来，既得到
由医药代表到最终消费需求医生处的12条最小路集并列于表(6．1)：
表6．1医药代表需要经常维护的线路
可能的合同
(线路)
参与人联盟形成合同支付
而医药代表一医生(12) 以10--20％分成合约
X6X7 医药代表一药房一医生(132) 统方费为0．5元，张处方
X2X6x8 医药代表一药房一财务一医生(1342) 维护费和租金、分成合同
X5X1xlO 医药代表一药剂科一药房一医生(1532) 开院费、统方费
医药代表一药房一采购一财务一
X2X3X4工j (15642) 统方费、租金，医生分成
医生
医药代表一药房一采购一财务一
X2X3x6工9 (13642) 统方费、租金，医生分成
医生
医药代表一药房一药剂科一财
X2XsXsXIo (15342) 开院费
务一医生
医药代表一药剂科一采购一药
x—sxlx9 (15632) 各种费用
房一医生
医药代表一采购一药剂一药房一
X2X3X4X6X]o (123456) 各种费用
财务一医生
医药代表一药房一药剂一采购一
X2X3XsXgXIo t 123456) 各种费用
财务一医生
医药代表一采购一药剂一财务一
X2X4X5XsXIo (123456) 各种费用
药房一医生
医药代表一药房一药剂一采购一
X3X4XsX7X8 (123456} 各种费用
财务一医生
6．5．3博弈联盟之间的竞争与讨价还价能力
在实际应用中，我们给N的某些或全部联盟s分配某一度量或值v(s)，它代表
局中人采用一致行动时得到的价值或势力。当s处于联盟状态且采用一致行动时，
v(s1可以表示集团s议会可确保最大报偿或结果，并且这个值独立于互补联盟N—
s，且是可实现的和超可加的。本文采用P．指标(John Deegan，Jr等，1982)来对各
个合同及参与人的势力进行计算。这种指标模型化了在一个集体决策过程中，可能
的成果分配方式。
60
华中科技大学博士学位．论文
由于每项x．恰是个人对联盟的边际贡献，它正好代表了网络中该链对整个联盟
的贡献，因而下面的P值同时用来估算参与人势力及网络谈判能力。在上表数据
中，如果联盟中包含x．，则取1表示某人在联盟中，否则为0。即表示它对联盟无
贡献。从而得到下表(6．2)：
表6-2极小联盟之间的合同竞争关系
x7 黾而而。Σ
— 0 0 l
X6X7
X2X6X8
XsX7Xlo
X2X3X4X5
X2X3X6X9
X2X3X4X6XIo
X223X5X9X10
X2X4XsXsXIo
X3X4XsXTX$
X4X5X7X9
X2X5％Xlo 0 1／5 0 0 1／5 0 0 115 0 1／5 1
这里假设： (1)取胜联盟只有极小联盟(Minimum Win Coalition；MWC)；取
胜联盟得到支付。(2)联盟之间有完全信息，每个MWC有相等的形成概率；
(3)在每个WMC中局中人平均分配成果；那么：
设(N， Ⅳ)是一个简单对策。对每个局中人i∈N，定义
／a(i)=(s∈∥li∈s)。
∥(矿除好是包涵f的MWC的集合。对策中i的势力定义如下：
I r I
胪两，毛，两
由表一的第三栏得到各个参与人的势力估算为：
p=丧(3，3’2．111．7，1．5，1．3)
6l
o
o
价
o
o
：呈
：呈
协
o
o
o
o
o
o
：呈
。
协
o
o
郴
O
o
仂
o
o
O
O
O
：呈
m
o
o
抛
。
仍
。
协
o
o
o
协
：呈
o
№
m
o
o
：全
：呈
o
o
o
o
o
o
o
仍
Ⅲ
o
o
协
协
啪
：呈
o
o
o
o
m
o
协
o
o
协
{呈
o
o
o
o
m
m：呈Ⅲ协{呈
o
o
o
m
o
似
：全
协
{全
!呈
o
o
j
i
D
D
D
D
D
如果合并后四项的势力，势力招标为：P={{，{，{)。分别代表医药代表、医生
和医院行政权威的势力。从中看出，从单个方面说医生具有很大势力(1／4)，然而行
政部门势力之和为1／2。这充分说明了医院内部双重权威的存在，因此在分析医疗
系统的行为扭曲时，处于代理状态的组织行为扭曲和医生个人行为扭曲是并存的。
6．6非正式组织的管理与势力运作
6．6．1医药代表与影子医院的讨价还价过程
1)医药代表的目标函数：max：{0，(p—s)D(s，力}，即：在取得药品供应资格
后，使自己利润最大化。其中的P，s分别代表供给价格和给予对方的合同支付，
(P—s)为药品进价差，医药代表用这部分差额来对医院和医生进行激励，共享利
润。D(s，工)是依存于消费数量的需求。
2)医药代表与相关权力机构的谈判：朋缸：兀(虬一s，)‘．口。代表谈判力量。s．
赫
为谈判威胁点，低于此点将会有人放弃合作而导致谈判破裂，各方支付为0。由于
有很多竞争性药商参与谈判，医院与医药代表的势力是不对称的。但一旦谈判成
功，j。可以看作是医药代表支付给对方的固定租金。业内人士指出，J，一般在5000
—10000元之间。
3)医药代表与医生的谈判：Max：@，一v。)4(“，一以IO))’。式中；U。、1,l，分别
为医药代表和医生的效用，v．为医药代表的谈判破裂点。a为分成比例，一般在10
一20％之间。D(工)是反映医生推销努力的处方额，医药代表能直接通过药房统计到
这一信息；口和∥是双方的谈判势力。
6．6．2医生的策略性选择及垄断势力的运作
设医生或医院收入函数的一般形式是：
a，冉，
y=f(P，t)，砂=要，_咖+罢一dr
op “
其中P是医生医疗服务的价格，既处方收入，它由医生的服务质量、市场竞争
程度相关；工，为医药收入。在一个运行良好市场中，给定的病人大抵不会在用药上
有太大的区别；但他通过服务价格途径获得收益。这样医生手中就有两把刀，医生
通过手中掌握的两把刀获得利润：一把治病救人的刀，当他具有高超的医疗水平且
得到相称的回报时，这把刀主导医生；另一把是用来“宰人”的，当医生不能通过
医术获得收益时，为了获得收入必然会祭起另一把刀：如收“红包”、接受医药代
表的合同、敲诈病人或者与病人合谋开大处方等都出现了。
6．7医院及医生的行为扭曲过程
6．7．1医院转变为药品经销商
如果医院是私人产权所有者，它就会像一个私人医生一样行动。剩余索取权赋
予了它的监督权，它将不允许“医药代表”瓦解正式组织的利润；然而在信息不完
全不对称环境下，监督成本的昂贵导致监督始终是不完全的。在“以足投票”和
“医生努力”难以监督情况下，内部的委托一代理问题迫使它提供足够的激励合
同，这个替代性合同能“排剂”出非正式组织。正式组织被“医药代表”瓦解既不
是医药一体化经营的后果，也不是合谋的结果，让人困惑的是：作为具有自己目标
的企业为什么放弃监督权限制医生的行为，又为什么不通过正当途径激励医生整合
双方的利益目标。监督者和激励者缺乏导致了非正式组织的渗入。而私人产权会导
致医院执行该机制，它有动力支激励和约束内部代理行为。当医院放弃了维护正式
组织(大联盟)的长期目标时，且继续保持垄断势力时，医院收益最大化就是药品
销售额最大化。医院变为药品经销商。
6．7．2医生转变为药品推销员的过程
我们对医生的收入函数微分并两边同除以y=阿得：
咖咖凼
亏2％号+％了
即给定需求水平，医生的收入增长与两个因素相关。一是调整医疗服务的价格
(害)，二是提高处方费(吵z)。但是，消费者对服务价格和用药数量的弹性
(叩，．叩，)限制了医生对变量的任意操纵，从而增加了病人的讨价还价能力。在一
级价格歧中，医生能够探索到病人的需求曲线，从而把消费者剩余全部占为已有，
但在一个竞争环境下，他必须考虑长期交往及信誉，因此医生须把病人支付意愿
(或预算约束)纳入自己的决策中，这导致了医生可能更多地依赖服务而不是开大
处方。因为， (1)医生通过服务质量能完全占有服务的剩余。(2)给定疗效，处
方优化会减少消费者支出，从而在不减少医生收入情况下，有利于提高病人支付意
愿。
因此，按服务收费机制是防止医生成为药商的节约机制。因为医生会自动优化
处方和品种，执行成本最小化目标。但是，当医院不能提供足够激励且监督动力不
足时，医生个人收益最大化就是推销额最大化，医生成为撤销员。
6．7．3目前几种改革方案没有斩断以上的兑变机制
一个最节约的机制必须满足两个基本条件：从个人理性出发，参与人有动力自
动选择参与该设定的规则，二是该机制对某些行为选择给予了激励，从而满足参与
者最大最小化目标。
1)医药分业经营：医药分业总是不完全的也未必是合理的，因为医生会作出
其它的理性选择来抵消这一政策效果。一是医生会试探用新药从而提高自己市场势
力：二是“过份”优化处方，为获得声誉而“用急药”，从而恶化职业道德问题。
因此对于降低药品价格目标来说，该机制不是自我实行的。
2)公开招标制：公开竞标可能导致“赢者灾难”。当医生仍然保留了滥用
“品种选择权”和“处方权”时，个人理性导致其“替代”掉中标药品。因为替代
厂商的医药代表会进入医院与之合谋、结盟。结果会导致大众药品退出市场，更多
的新药或过度的“质量”消费。如果医院是一个完全的企业，药品选择、价格选择
等参数会自动进入医院决策函数，因而预期会有最优的价格、质量组合。现在由政
府介入价格选择过程，而质量、品种等变量仍由医院操纵，等于在医疗市场中更多
地引入了参与人。它的理性条件会导致“招标办”寻租活动，而利润目标导致可能
的进一步结盟，从而使问题复杂化。
3)药品收入上缴财政制度：医院兑化为药品商主要来自两个方面的动力不
足，即医院缺乏剩余索取权激励，及服务自由定价权缺乏带来的监督不力和激励不
足：二是医生不能通过内部得到激励，个人理性导致他寻求外部激励，从而使医药
代表内生性地被引入。医院内部的参与人关心个人收入远胜于关心医院收入，由于
上缴利润(石=(P—s)D(p，s))来自于消费之后，医院令(P—s)D@，D=0来选择价
格和分成比例p‘，s’，这意味着医院药品进价上升，同时医院各方获得更多的合谋
收入s。。结果不仅不能限制“大处方”，还会导致消费者福利受损。
6．8本章政策意义
本文所讨论的医疗系统内的非正式组织(联盟)，是众多非正式组织在特殊行
业的具体表现之一。在税收系统、企业系统或任何一个正式组织内，以联盟形式构
成的非正式组织都极为普遍。联盟以其对整体福利的影响表现在两个方面：一是合
华中科技大学博士学位．论文
作博弈形式的联盟。这时，联盟被认为是为了探索更有利的支付来提高博弈各方的
福利；二是合谋形态的联盟，它牺牲整体的福利而增加小联盟价值。
但是，如果一个组织(大联盟)既满足了效率标准和公平标准，它将使参与人
不能通过结盟行为来改善支付，此时非正式组织将会被替代或“排剂”出去，因此
联盟不都是消极的。它为我们对医疗市场的行为修正机制的设计提供了非常清晰的
线索。
1)联盟理性条件说明，如果联盟达到了有效率的稳定结构，那么它就处于均
衡状态。此时，参与人不可能通过探索到更好的结构来改善支付，同时，其它人结
成的阻止联盟也不能威胁到他的支付。而非正式组织的存在则说明，正式组织并没
有达到有效率的规模结构。从而导致参与人探索更好的支付结构来套利。因而非正
式组织形式的联盟存在是正式组织是否有效的信号。
2)从个人理性来说，个人关心自己的收入，因而非正式组织反映了组织机制
出了问题。企业可以从两个方面使个人不选择结盟，一是给予关键人足够的利益补
偿，使之收益达到产出边际。因为此时，它选择正式和非正式组织服务是无差别
的；二是加大惩罚。使选择结盟的潜在收益低于不结盟的收益。因而结盟是组织机
制是否合理的信号。
3)结盟收益既反映了它对联盟贡献，又取决于它在n一人博弈中的市场势力。
而市场势力与市场结构有关。当市场是垄断的、且一个人具有众多结盟策略选择的
自由，那么我们削弱其势力将会导致非正式组织瓦解。例如，引入阻止联盟，如在
医生与医院之间引入竞争联盟、让药品商与病人直接沟通(药店)、组织治理结构
的改进等都能削弱非正式组织的结盟诱惑。同时，如果在医生中引入竞争将会平均
其势力。因而联盟是市场是否具有竞争性的信号。
4)联盟形成既与利益相关，也与结盟成本相关。在医疗系统中，药品商、医
生及内部长期互动，且有许多廉价沟通机制，加之监督机制不完善导致合谋成本下
降。因而消除合谋之间的这种交易成本很重要。
7企业的信号性质
——从“随机交易”模式到“信患包交易”的诸多特征分析
把～个企业看作是许多产品或特征结合的联盟状态时，任何产品或企业都可以
看作是一个信息包。文凭、专业证书、资信证明、产品方案等都代表～种商品，这
种商品尽管包含了非常复杂的搜寻过程和生产过程，但交易却异常简单，且确认、
识别也非常容易，从而避免了人们对市场的大范围搜寻过程。如果市场信息是均匀
性的，消费者将不得不对市场进行随机搜寻。因此要想完成有效交易，它必须遍历
整个市场空间。显然，搜寻效率低下和昂贵的搜寻成本限制将导致市场无效率。但
是如果各类专业性企业对市场信号进行分层、分类、局部搜寻，并打包销售，那么
信息就会以链状或网状方式成长优化，本文将称之为信息供应链和信息网。链和网
的节点是一些打包产品或企业一信息包。下一级消费者只通过对不均匀的市场：企
业、品牌、商标等进行搜寻而不必对整个信息空间进行搜索。本文证明，在包交换
下，尽管消费者只搜索了有限空间但却对更大信息空间进行了搜索过程。这不仅会
提高市场选择效率，而且会大大节约交易费用。但是依靠对信息包的搜寻代替完全
搜寻也会带来风险，一些不良的产品、企业或特征会得到保护并在信息供应健和供
应网上传导、累积而不能淘汰，这也是信誉经济的困境。考虑一下美国安然公司、
我国上市企业造假案例的冲击，便知该文几乎重构了这一历史过程。
7．1概述
市场现状及演进方向是消费者和厂商相互“选择”决定的。对于如何分析市场
搜寻及进化过程，长期以来存在着两种思路。基于个体理性的优化研究方法和基于
群体自然选择过程的研究方法。前者强调个体理性在市场决策中的作用，后者强调
“自然选择”压力的优选过程。
自从施蒂格勒(stigeler,1983)[731使用搜寻来解决市场信息问题以来，经济学许
多模型都开始重视这种选择过程对市场的影响。其中，搜寻模型(McCall，1970，)把劳
动力就业过程也看作是一个成本、收益和风险决策过程；销售模型(Varian，1980)
1741分析了厂商如何利用信息优势进行价格歧视，显然他们注意到了知情者可能的策
华中科技大学博士学位．论文
===========================#=======一==
略问题。所有关于搜寻问题的市场模型都认为，搜寻是个体解决信息不对称、不完
全的替代方式之一，但信息成本影响了市场的优化过程。
另一类研究方法认为市场优化过程类似于生物进化过程，从而开创了进化研究
法(Tirole，1986)[75]o这类方法基本上放弃了新古典主义对个体理性的假设，从长
期、大群体角度来模拟群体的进化过程。并且认为，市场选择过程会导致消费者和
厂商都向理性方向发展。沿着这一思路的有阿尔钦(Alchian，1950)，Hershleifer．
J(1977)，梅纳德．史密斯(Maynard Smitll，1974，1978)、纳尔森(Nelson and
winter 1982)，和艾克斯诺德(Axelord，R，R，1978，1981)等。
对于大市场优化问题，上面两种方法都存在缺陷。把一个大市场的优化问题简
化为一个优化问题，完全忽视了有限理性和有限信息要求(Willianmson，1985)
[761。在现实中，优化一个“市场”或“社会”方程问题需要涉及到复杂的计算，有
限理性、有限信息和交易成本问题将导致这一过程无法进行；而完全依靠“自然选
择过程”来优化则只考虑了长期的“生态”后果，忽视了个人理性的作用。
按照科斯(coase，1937)和张五常(Chueng，1983)闻等理解，企业是市场的替
代，它是一个内部市场的集合。那么，企业或产品内部已经包含了大量的交易信
息，而企业提供的产品或服务也不过是一个带标签的信息包。正是因为大量代替消
费者进行搜寻的厂商，市场搜寻效率才会大大提高，交易费用会大大下降。如果没
有这些企业，市场信息将会趋于均匀化，消费者会随机搜寻。但有了专门信息厂
商：大学、中介机构、生产企业、商业企业等进行分类、分层、局部搜寻和优化，
消费者搜寻空间会急剧下降，因为它不再需要关注过多的中间环节。但是模式化搜
寻虽然能从较少样本中得到大量的交易信息，但也为企业提供了机会主义空间。并
且信号之间的链状依赖和网络化成长将使许多无效的特征潜形于网络中得到保护，
从而增加了市场选择难度。
本文的思路如下：在给定的信息和成本约束下，个人理性只限于优化一个局部
的目标函数；给定别人的最优决策，理性人只需优化自己的目标函数而不需要对整
个信息空间进行搜寻，因此它可用来解决与交易费用相适应的有限理性和有限信息
问题。这样整个市场优化问题将由各个独立的经济主体分割执行优化，最终优化了
整个市场网络。这既是个人理性的，又是基于市场选择的。更重要的是，所有这一
分析过程都基于一种假设：企业或产品都是类似于标签一样的简单信号，它的内部
是一个优化的信息包。品牌、商标等标签的功能是，把大量的交易信息简化为几个
易于识别的信号，因此它是一个成本节约的交易机制。由于标签是信息包的不完全
信息表述，因此一旦在某一环节偏离了最优路径，这～错误将会在信息供应链及供
67
华中科技大学博士学位．论文
应网中得到有效保护而积累、传染。显然，企业的这种信号功能在经济理论分析中
目前还是一个薄弱环节。
企业显然是一个不均匀的信息包。作为“自然选择”的结果，它是市场在长期
演化过程中作为一种优良特征而出现的。早期资本主义自由竞争时期曾经出现过大
量的信用危机，一直到后来各种合同、证件、大企业品牌广泛出现时期才得以缓
和。按本文的分析模式，我认为这是一次整个社会信息搜寻模式进化的结果。恰好
我国目前也正处于这一时期。因而我们可以把目前的各种不良的信用危机状况看作
是一种正常的过程，或许他是我们市场经济向更高级阶段进化的“临介现象”。因
而不仅可以预期将来的趋势，也可以从分析结论中发现一些解决问题的线索。这就
是本文的实践意义所在。同时，它的理论意义是，在众多的企业性质中，我们发现
了企业的另一起源闯题。那就是信息包交易的诸多超过随机交易的信息功能。
7．2简单市场交易环境下的搜寻效率
7．2．1随机搜寻下的交易过程
1)两类厂商两类消费者情况
假设： (1)只存在两种产品(A，a)和对应的两类顾客(A，a)。消费者遵守两
条购买法则，单一购买和随机混合购买策略。如果消费者需要的与厂商供给的相匹
配，消费者下次将认准该品牌，永远购买该品牌，厂商也提供该品牌，市场按专业
化方向演化；如果消费者购买到的产品是随机的，那么市场提供的将是混合信息，
消费者继续随机搜索，混合购买，一旦碰到相匹配交易则转入单一策略，否则继续
搜寻。
2)在开始交易前，市场上这两类顾客和产品比例是均等的。即厂商混合提供
{4：{口两类产品；消费群结构为告爿：{口。
在此假设下，让双方相遇发生交易。可能的交易类型为：【1AA；2Aa；1aa]。即，
交易正确概率[AA]和[雏]各占25％；错误匹配率[Aa+aA】占50％。
下次交易时，【从】和[砚]类型的交易将导致【÷4+}4】【}爿+}4】和
【{口+{口】[圭口+{口】两个专业市场出现；而【Aa】型交易将重复第一次交易过程：
【{爿+{口】【}4+{口】。以后每次都重复这一策略。交易过程与结果如表7-1。
华中科技大学博士学位．论文
表7-1简单市场交易方式
代数混合购买
不同交易组合分离购买
比例％
O Aa 0 100 0
l lAA 2Aa laa 2，4 1／2I=50 1．1／2{=50
2 4AA 2AA 4Aa 2aa 4aa 4／16 1122=25 1-1／22=75
3 24AA 4AA 8Aa 4aa 24aa 8／64 l／23=12．5 1-1／2’=87．5
4 112AA 8AA 16Aa 8aa 112a,a 】6彪56 1／24吒．25 2／2'--93．75
●●●
R l／2r_+0 1．1／2’一100
从表中可以看出，当交易进行到第n次时，市场上购买匹配正确的比例为：
x％=(1一击)×lOO (7—1)
显然，当交易次数，趋于无穷大时，随机交易类型的概率下降为0，专业化
交易比例接近100％，即，消费者全部与各自对应的厂商在专业性市场发生交易。
3)多种商品和多种消费者
假设消费者和消费品各有n类，那么在上述购买规则下，消费者遵循随机交易
策略。此时，市场优化过程不仅与交易次数有关，而且随着消费者和市场多样化，
正确交易率将下降。那么当交易进行到，代后，市场上交易类型的分布为
(1+(2’一1))”的展开式中的各项。
其中，ql”(2 7—1)o=l表示所有消费者都买到与之对应的厂商生产的商品。
c：_i1(2’一1)1=n(2“一1)
c：(2’一1)4=(27一1)“
下图是考虑了交易次数与产品结构的复杂性对优化过程的影响。从表中可以看出：
华中科技大学博士学位论文
虽然随着交易次数的增加最终都取极限过程，但简单产品则快得多。
7122非随机搜寻：重复购买与消费群具有记忆力
简单市场假设市场只存在两类商品和两类消费者。这类购买规则是，消费者每
次只认准一种品牌进行交易。假设市场初期有【}彳+{口】两类产品，相应有
[{一+扣]两类顾客。交易一次后，将会出现以下几种交易状态：
({彳+扣)({一十{口)={44-I-{月口+{剃+{彻a
接下来，如果交易类型[Aa]中一部分永久性转向与[AA]类型发生交易，
另一种交易类型将永久转向[拍]类型。如下表所示，这种有偏好的交易策略将导
致市场快速向两个方向分化，最终混合市场走向了两个专业性市场或者退出市场。
表7-2有偏好交易策略
代数品牌偏好购买分离购买率
(aa) (AA) Aa AA
0 aa Aa AA 1／2 K
l ∞ I／2aa：l，2AA AA 1／22 1／22
2 ∞ 3／4ca：1／4从!／4甜：3／4AA AA 1／23 |／23
3 ∞ 7／8缸：I，8AA I，8∞：7／8AA AA ●●● ●●●
15／16aa： 1／16aa：
4 ∞ AA ●●● ●●●
l，16AA 5／16AA
5 ●●● -●●
R ●●● 1／27 1／27 ●f●
在上面的交易过程中，交易的过程都被累积记忆下来。完成每次交易导致的匹
配正确率依次上升为{一{B+{)专；一等÷豆31。或者用下式表示：
x％=‘丁2r--])”，而随机交易的正确率为：x％=‘了2r--I)1(圭)”。它比有
记忆的重复购买方式的优化效率低。
7．2．3市场选择强度与市场优化策略
1)对低质量交易的淘汰
选择是促使混合市场向目标市场优化的重要途径之一。对市场选择来说，有许
多种可供选择的选择方式： (1)以政府干预方式的强制选择。即对不良商品或厂
商的打出，强制退出市场，或者阻止该类交易进入市场； (2)政府的公共信息政
策。它促使消费者对产品的正确认识，从而便于消费者的正确选择性决策。(3)
消费者的货币选票。这种选择过程是，对消费者购买或不购买行为自动对市场商品
结构进行优化。
设在开始时【{彳+{口】[{爿+{a】，各种产品的市场比例为50％。经过一次购买
后，低质量的交易(aa)将有1，4的机会出现。于是这类交易被淘汰出局。此时A的
频率变为2／3，“a”的频率为l／3．．由此下一代频率之比为：
((号)2AA：2x；×{爿口：({)2aa)。
其中I／9的商品又被淘汰掉。如此经过11代后，市场上各类商品的比例为：
南胍斋触赤们(玎+1)2 (H+1)‘ (疗+1)2
2)分类选择与淘汰
分类淘汰是指消费者通过选择过程，引导市场向合理的产品结构转化过程。比
如，A类顾客只选择与A类商品发生交易，它的选择结果是淘汰了a类产品，结果
出现了AA型的专业化市场；而a类顾客只与生产a类商品的厂商发生交易，任何
A类产品都在该顾客群中被淘汰，结果出现了aa型的专业化市场。虽然分类淘汰是
最常见的市场选择过程，但其淘汰机制却与质量选择相同。
设未经选择的市场上a类商品的交易份额为吼，90包涵两种类型交易，一种是
R。=aa，另一种是混合类型，Ho=Aa。那么，90=半+％。
现在对于A类顾客群来说，它不与任何带有a类商品特征的厂商再次发生交
易，所以它将把aa类产品全部淘汰，下一次它所面对的市场上，aa类产品比例下
降为：
q；曼!!!：堡!! ：鱼(7—2)
l 2丽--v--2二P；+2poqo 3赢u之’
以此方式重复进行n次筛选后，A类专业市场上aa类商品的市场占有率为：吼=熹，显然，憋吼=onq po+o
⋯
时间趋于无限说明了市场的最终演化趋势，即通过市场筛选过程，厂商最终会
向专业化方向发展，这是厂商和顾客相互作用、优化后的结果。假设给定目标市场
专业化交易达到比例，从上式可以看出，达到理想淘汰目标的交易次数为：
，，：土=一一一1 (L，’／j．，3)
q。qo
例如，市场上似类产品的初始占有率为吼=50％，要使其达到1％p2T，则需
要98代次交易。但若我们把目标控制在10％，则8次以上既能达到要求。一般来
说，随着淘汰的进行，～些被淘汰的产品比率越来越小，淘汰成本也既迅速上升。
正是这个原因，一些目标淘汰品能够在很小范围内得以保护。
7．3大市场环境下的搜寻及交易特征
7．3．1大市场中随机交易的搜寻效率及性质
1)大群体随机交易的稳定性
设大规模市场存在三种交易状态[AA，Aa,aa]，其相应的交易数量为
In。，刀：，％】，则令【塑，n__L2，生】=[D，H，R]，其中，D+小足：』。D、H、R分别为
九玎行
AA、Aa和aa类交易所占的市场比例。现在让市场随机交易，那么交易不过是在不
同类型之间的随机转移罢了。最终我们得到各类交易类型之间的转移概率为：
表70不同交易状态转移概率
AA Aa ∞
O
AA D+H，2 R+H／2
D，2+H／2+R，
Aa D，2+H，4 R／2+H，4
2
∞ O D+H陀R+H忍
给定上表的状态之间的转移概率，构造各个状态之间的转移矩阵p为：
p=㈥
质，各个状态最终将出现稳定交易类型比例，这个比例是下面方程解组的解：
∥I+导V2=Vl
g”l-{”2+∥3=v2 (7．4)
罟V2+gv3=v3
VI+V2+V3=1
解得不动点向量为：V=【p2,2pq，q 2】即为各个交易状态的稳定概率。
2)大市场随机交易对错误配置的保护功能
从(7-4)式的解向量可以看出，在一个充分大的群体内进行随机交易时，许多
混合类型(Pq)的产品不能进行有效分类和识别，结果使交易类型稳定于
V=[p2,2pq，q 2】。在这种稳定的市场结构中，我们发现始终存在2pq[Aa]类型的交
易不能排除。因而大群体随机交易具有对混合类型的保护作用。假设所指产品是高
质量和低质量，那么我们可以看到，低质量产品将以一个稳定比例存在。产业经济
观察也发现，对于流动性大的交易中心，它满足以上的大群体随机交易特征，那里
不仅保存了许多复杂的市场交易类型，而且低质量确实可以混杂期间。例如，武汉
的汉正街小商品市场。同样也可以发现，在一个大城市中，各种类型的商场、商
品，尽管质量千差万别但却能长期共存。不存在完全淘汰情况。因此在～个完全随
机交易的市场中，如果没有其它因素(如创新、搜寻、选择和迁移等)干扰时，市
场内产品和消费者结构将达到平衡状态。
7．3．2非随机的市场搜寻和选择过程下的市场优化性能
假设市场上有n类消费者和n类相对应的差异商品。消费者可以在各个商品
之间进行探索，交易只发生在相匹配的市场而不是上面所说的随机购买。当商品
类型不能与消费者期望产品类型相对应时，消费者将向其它产品转换，继续探索
满意的交易。这样就存在一个转移矩阵W为：
矽=
交易规则如下： (1)消费者在市场购买过程中，一旦购买到了满意的品牌，
他将重复购买该品牌商品，即消费者一旦进入该状态，将以100％概率停留于此。
(2)当出现了混合匹配类型时，继续在市场上搜寻。那么，具有这种转换性质的
消费者的选择过程是一个带吸收的马尔柯夫矩阵。该矩阵的转移概率具有以下性
质：
(1)pJj 2l，f-，
(7．5、
(2)p。=O,i≠_，
、。
凡％～珊
即当消费者只停留在单一购买策略上而不存在对其它品牌(状态)的购买时，
它在主对角线上取1，而对其它状态购买量为0。吸收马尔柯夫矩阵具有如下的典
范性质：
蜘l纠，黼
E是r×r单位方阵，它代表吸收状态，即r种消费者购买相对应的r种商品。
0是r×jo矩阵。矩阵元素皆为0意味着在吸收状态的消费者对其它品牌购买的概
率为0。
R是_，×，阶阵。它代表着从任意状态一步就可以过渡到吸收状态。
Q是J×J阶矩阵，它表示从一个状态转入新的转移状态的概率。
由于重复购买将导致消费者遍历所有的市场状态，它是矩阵的多次乘幂。而典
范式转移矩阵的乘幂按分块运算有以下结果：
，2K多l 口s，
其中，R，=(E+Q+Q2+⋯+Q’1)Ro。
依吸收马尔柯夫典范式转移矩阵性质有以下结论：
1)当t斗∞，Q‘_o。即处于转移状态的交易为O；
2)E-Q可逆。即产品之间是相互独立的，并且消费者可以达到任何一种消费
状态。
3)N=(E—Q)一=E+Q+Q2+⋯Q”。
根据吸收马尔柯夫矩阵有关定理，结论(3)或解释如下：具有r个转移状态的
吸收马尔柯夫链，从转移状态‘=，+f开始，经过N=(E一9一=E+Q+92+⋯9”
的第i行第_，列所表示的交易次数后进入转移状态^=，+，；最终进入吸收状态的
概率正是矩阵B=NR的第f行第，列之值。
由此我们可以看出，消费者最终都会转移到各自的吸收状态，既实行专业化分
离购买。不过有的产品需要时间长，有的时间短。一般说来，如果交易商品是经验
品和搜寻品，由于交易有许多可识别的确定性特征，消费者搜寻的时间相对短一
些。对于信任品来说，由于产品特征的交易信息高度不对称，其搜寻过程类似于随
机交易，因而靠搜寻不能解决信息问题。根据上面分析的随机交易对隐蔽信息的保
护功能可知，它不能完全有效的进行淘汰。
74
7．4信息包交易：企业、产品形态的交易过程
由于任何厂商或产品本身是一个信号密集的市场，它虽然向市场提供的只是一
个产品或企业名称等标识性信号，但大量的交易过程都已经内部化。常见的现象
是，消费者似乎只认品牌进彳亍消费决策，只到几个商场购买，而不是遍历所有的市
场。这是一个有趣的机制。是什么保证厂商和消费者以这种方式进行市场组织和消
费选择?它是有效的吗?
7．4．1产品、企业的模式及模式定义
为了更好的对上述现象进行解释，这里引用遗传算法(Genefic Algorisms)的
方式来定义信息产品并利用该原理的优化性能(Holland J H．1992)t78】洞悉信息市场的
组织过程。任何产品或企业都是一个包含复杂信息的信息包，它可以用许多种特征来
定义。这些特征可以用字符集来进行表示。最简单的字符集是二值字符(O，1)所组
成的信息编码串，任何一个企业或产品都可以用信息编码串来表示。例如一个产品
或企业的诸多方面特征可以用表格中的各项定义来描述：
表7-4特征定义表
0 1 2 3 4
产品行业银行业建筑业
医疗业电器加工信息咨询
质量低高
价格高低
寿命短长
可靠性好坏
企业信誉C B A
服务承诺无有
那么，一个金融企业必是V=I 11 11 11和V----(1000000)之间的某一种组合：V=
(1★★★★★★)。这种组合个数达256种之多。一个模式就是一个信息包，它
由许多种信息链接组合而成。由此我们借用“遗传算法”原理来进行分析。该方法
是模仿自然选择的优化过程来进行优化分析，而这里则是把这种方法重新还原到市
场“自然选择过程”，寻找优良的市场进化特征。
1)模式(Schema)及模式数量
模式表示一些相似的模块，它描述了在结构上相似的企业或产品。当企业结构
上的特征是可识别的，即具有一些确定性特征时，我们可以用0或1表示，而不确
定性特征必是0或l中的某一种，用“★”表示。例如，V=(110★l★0)表示高
质量高价格可靠性高无服务承诺的金融企业，而产品寿命和企业信誉是不确定的
(用★表示)。与此相匹配的相似企业可能是下列中的一种：
1104110，llO‘100，11001+0，1101l+O，1100101，11001ll，1101100．11011lO。
这样，～个产品或企业是包含许多不确定性的信息包，包中的信息编码包含了
多种不同的相似模式。如果信息空间用工表示的话，那么包含七个序数的企业模式
共有(七+1)7个。
2)模式定义长度与阶
在每一个模式中，企业或产品确定性的性状为识别企业或产品提供了一些确定
性信息。这些确定性信息的数目称为模式阶(schema order)，记为o(H)，例如O
(10A-★0★1)-----4表示有4个特征信号是确定的。
模式H中第一个确定性特征到最后一个确定性信号之间的距离决定了模式结构
的复杂性与创新空间，记为占(H)，或称为模式定义长度(Schema defining length)．例
如占(H)=11★★★★0----5。它描述了一个企业或产品的七个特征，其中从第三个
到最后一个确定性信号之间的距离为5。
7．4．2模式化搜寻的选择效率与特征
1)模式搜寻下的市场选择效率
市场的产品和企业是消费者选择的结果。选择既依赖于选择策略，又依赖于选
择强度，同时依赖于市场信息。一般来说，所有消费者选择策略都有一个共同特
征，即保留最优的厂商和产品。这里假设是按平均选择策略，即企业或产品按平均
适应性的比例保留。那么具有高于平均特征的产品或企业将具有最佳适应力。
设当前(f)群体eo)中具有模式H的企业个数为mf强0，经过选择后下一代仍
保持同一模式的企业为ma-L,f+J)，那么如果以某种方式度量的企业适应度(例如以
利润或市场占有率来衡量)总和为F(f)=ΣF(A，)，而与模式H相配的企业个数4，
磊
能平均复制M．兰!婴个，那么下一代个数为：
，。
m(1-i”1)=Σ小。锵=Σ等铲=m(iq，，)．等
其中，f(H,O是企业类型为H的平均业绩或适应度。令上式中丛掣=l+c，那么经
过f次选择后模式为H的企业群体将以指数方式增减如下：
m(H，t+1)=m(H，／)(1+c)=m(H，0)(1+c)。(7-7)
华中科技大学博士学位．论文
当c>0，表示经过市场选择后具有该模式的企业或产品将以指数方式增长，当c<0
时则以指数方式下降，最终退出市场。
2)创新、学习及随机干扰环境下的模式稳定性
由于环境变化及市场的创新、学习、摹仿或随机性因素的干扰，任何一个企业
模式都不会永远毫无变化的。但是，任何企业的变化都无非是模式变化或内部结构
变化，这种变化可以用模式的生存率及变异率来度量。
模式生存率：如果是占(H)发生变化，那么该模式结构将会发生变化从而破坏
该模式。模式生存概率是随机事件冲击的结果，我们不能准确地把握它。但是可以
肯定的是H的长度发生了变化。那么这种模式H的生存概率的下界为：
P；≥l—p。≮掣
肌(H，f+1)≥m(H，r)(1+c)【1一P。!笮}】(7-8)
模式变异率：假设企业面对外部冲击发生的适应性变化不是结构性的，即不破
坏其模式的话，那么它发生的变异必然是模式内部结构信号发生变异，即“★”的
变化。设变异概率为P。，则1-(1-p。)。‘”’“o(H)p。
由此知其该企业保持内部结构不变概率或生存概率为：
P，*1一o(H)p， (7-9)
模式总生存率。由以上二式得：
m(H，，+1)≥聊(日，f)』等警【l-p。等掣一o(H)p。】(7-lo)
由此可以看出，一个企业的稳定是指其战略稳定性和内部结构的稳定性。如果
企业保留了战略稳定性，即经过市场选择过程仍能保持其模式的的稳定性，那么我
们说该模式是抗选择的。从上面的结论可以看出，越是结构复杂、不确定性特征少
的企业越具有抗逆性。
7．4．3信息包(模式)交易的节约能力和效率
判断搜寻模式的性能主要体现在： (1)它是否具有优化性能，且个体优化
(个人理性)是否达到了群体优化(群体理性)； (2)它是否是一种费用节约的
机制； (3)是否合理利用了所有专业化能力和信息。信息包搜寻的优化性能恰好
在于通过个体的优化执行了整体的优化问题；它的节约机制是不需要对接个信息空
间进行搜寻，从而使交易次数大大下降，节省了交易费用；而每个阶段性优化主体
是在有限信息条件下对信息打包和信息包内的优化，这正是专业化能力的体现。由
于交易需要多样化信息，因而市场中的大量主体都可以通过专业化途径获得相对优
势，资源也自然得到了充分利用。
1)信息包搜寻的优化性能
77
下图怒一个篱鼙翡交易网络，图孛每个躅圈帮代表一个毽健金堑，英强标楚最
大化向量：V=Max【PI】。任何一个其它企业都可能熄它的买方或卖方。那么根据贝尔
曼原理，任何把一个企业看作是n阶段的决簸，那么它只关注n-I阶段与自己相邻
的金泣帮霹。
(1)下图中每～个圆圈都代表一个最大最小化目标函数的企业。所有企业之
间发生的物质、信息流交换构成了～个投入产出嘲络。这个网络代表了一个简化的
市场。
(2)根据假定，每一个企业都面临着有限信息、有限理性和交易赞用的约
束。在此约束下，充分手0用自身的优势。
(3)一个市场优纯避程(1--9)《疆裰据辩阉鬣空翔划分为若学令麓裰联系
的阶段(1—2，2—3，⋯6-7)。任何一个阶段，都可以由一组状态变惫来描述，记
之为向量P；
(4)每伞阶段都俸澎决繁、接系统出款态P转换为P’：
艺f别=P’，q∈Q，q代表一个决策，Q是允许决镶集合t
例如，一个企业根搦自己的生产鼯数把投入转化为产出，这个产出对加工企业
楚一件产晶，对服务企鼗刚怒一套服务方案，或～张文凭，一个资信证明等。这些
产品捧建下一跄段众业兹投入。
(5)对每一个决策砸言，系统在第i阶段之后所作出的决策与此阶段之前的历
史无关。既具有马尔柯夫性质。
袭7-l一夸篱革的市赣两终
2
由于我们已经把给定的一个市场优亿问题嵌入一簇优化问题之巾，缩渠，在傥
纯～个绘定静嚣标辩，蜜际土求解了整簇蕊纯簿驻。帮一令枣璐优他润嚣分麓必各
个除段螅企业来优化闯题。根据贝尔璺(R．Bellman，1951)f7卿最优性原理：“作为
整个过程的最优策略具有这样的饿质，即无论过去的状态和和决策如何，对前面的
华中科技大学博士学位．论文================================= =
决策所形成的状态而言，余下的决策必然构成最优策略”。即，企业分散优化执行
了整体的优化问题。
2)信息包交换的信息节约能力
考虑111个矩阵：A。爿：，．．．A。。每个矩阵代表一个企业，它是一个譬如由行业、
资产、规模等特征定义的一个信息包。各个矩阵的阶数依次为‰n。，啊一：，．．．n。月，。
设A=AtA2⋯A．彳f+l⋯Aj-iA，¨．A。中的一段爿，4¨一4A¨⋯4『_lA，作为一个大市场
中的一个子市场，这个市场是一个复杂的信息交易投入产出网络。当各个环节是一
个代理问题时，它是纵向或横向一体化的；当各个环节都是独立的优化过程且各个
环节相互交易时，它是一个市场交易网络。～个交易费用最小的机制是，什么样的
市场组织方式能使整个市场达到最优的目标且搜寻费用最小，即总的计算量最小问
题。上面的结合方式可能有多种：
A。(4l+l⋯爿t4I“⋯4J—lA』)
44”～(44”．．4一，4)
A，一』+l⋯AI(A“1．．一J一1A』)
(A。一I+l⋯爿★4+l⋯4J—1)AJ
一般地有：(一．一。⋯4)(一¨⋯Aj一。Aj)。前者为Eli_1‰后者为仇_a设‘为矩阵
A中的部分交易市场的乘积，最优结合相乘所需的最小项数可由最优化原理得出：
f o，i=，
驴1。缘。(兀帆一?li_lTlknj"<，口。1 D
这个乘积数一定是最小的交易次数。例如，一个
Al：10★20；A2：20★50；A3：50*1；A4：1★100的最优结合过程及运算次数是：
A=[4(4：A，)】爿。=2200次，而4【一：(4A。)】-125000次。这个次数在2200—
1000000次之间。但信息包交易仅仅发生16次。
3)专业化优势与资源利用
专业化优势体现在两个方面：(1)从‘(p)。p’，q∈Q可以看出，利用现有信息和企
业内部的生产系统转换为一种新的产品的效率，这个过程由专业化厂商的生产函数
的转换效率决定； (2)而爿．月。⋯A。A。⋯A』-lA，中的不同组合，体现了企业与市场
华中科技大学博士学位．论文
主体的交易过程，即如何组织利用内部资源的整合能力和外部资源的能力。其外在
表现是，一个信息产品的质量、价格、成本等多方面的竞争力。
7．4．4信息包搜寻过程的隐含并行性、欺骗问题及风险特征
1)模式搜寻的隐含并行性及搜索效率
在市场选择、搜寻过程中，虽然我们只与M个企业或产品发生了交易，但由于
每个个体中都隐含着许多种模式，因而我们事实上已经与许多企业发生了交易，即
搜寻具有并行性和网络性。具有专业化优势的组织如会计师事务所、律师事务所、
数据公司、中间产品、大学、行业协会等，甚至政府也进行信息生产。例如当我们
只与银行发生一次交易时，事实上我们是与一个金融企业、金融产品、相关法律、
咨询机构、服务人员等多种信息打交道。
仍以(O，1)二分变量为例。一个长度为“信息空间)的企业中隐含的可能信息
模式为3 7种。如果以K表示各个特征的变化范围而不是简单的0或l时，K一
(1，2⋯七)。相应的隐藏模式为(七+1)’。这样规模为M的交易过程可能隐含的模式
数为2。一M27。下面是一个市场A中模式为H的信息包：
A=aI口2．．田I⋯口，+tsaaaaa
H=+··+Jl⋯sh+···
’
则一个确定模式s的起始位置到终点长度为o(H)=I-Is+I，期间可能全部是确定
性的，如集成电路产品，或一个简单的企业，也可能包含大量不确定特征(是"A-，
0，l中的一种)。如果市场上企业数为M，则隐含的模式个数为：
M．(，一，。+1)2‘～。
若M较大，则肯定有许多低阶模式是重复的。为了排除这些重复部分，取群体规模
为M=2吲。这时模式阶高于或等于tler的模式最多只重复计算过一次。由此估算
排除重复模式后的模式数量玎。约为：珂。≥—M．(I-l,—+1)．2t'-I。皇二塑M3：cM3：O(M3)。(7．12) 4 2 2
即虽然交易只发生了M次，但我们却处理了与该次数立方的模式数，这种隐含搜寻
过程使市场能以快速方式搜索大量的信息，搜寻费用大大下降。
2)隐含并行搜索的欺骗问题(F砌tzDR，1972[801，Goldberg，DE，1987[s11)
通过搜寻小群体过程来获得大量交易信息，与我们只通过企业品牌、商标进行
购买而不再干预过多的细节极相符合。例如当你购买电视机时，你只需与厂商发生
责任关系，而不必了解零配件厂商的生产产品过程、质量标准；一个集装箱、邮包
80
华中科技大学博士学位论文
传递过程也只是发生包一箱一包交换，不必每过一关都打开检查。一个文件转录到
另一磁盘过程，你可以通过打开文件重新存储，也可以只直接发送到目标磁盘上既
可。
但是由于信息包交换发生的是不完全的枚举搜寻法，难免会出现以下问题。
(1)一是我们的信任为企业提供了机会主义行为空间。这是逆向选择和道德风险
的来源； (2)一旦有不好的特征隐藏在模式中，消费者选择就不能较易淘汰它。
大市场、企业内部都具有这种屏蔽作用。(3)经济交易具有供应链和网络化特
征。一旦在某一环节筛选失效，那么这种欺骗现象会不断地传递和累积，从而提高
了整体风险。
3)模式搜寻中的风险积累
设一个产品的供应链为：4=M4扣．爿小其中的中间品是诸如A，=【11+·+0l】或
A2=[0121·0H此类带有不确定性的产品模式。这些不确定性可能导致交易者关注过
多的细节，因而违背了上面所说的马尔柯夫无后效性条件。设各个企业内部完全确
定性结构信息的概率为：0≤P．≤1．那么一个供应链整体的完全确定性概率为：
P=【J。P，≤P， (7-13)
即，随着企业或产品信息包交换链条的沿长，隐含搜寻模式保护和积累了各个
交易环节的风险。特别地，如果任何一个环节取p,--o，则P=0。即，整个信息供应
链崩溃。
但是供应链积累的极端风险性可能会随着供应链网络化而得到部分缓解，但网
络会进一步降低选择强度和淘汰率。设G是由n个企业组成的一个交易网络，由于
网络内部有很多条道路可以连通，从面减少了对一个链路的依赖，结果使交易网不
至于崩溃。设每一个企业(模式)可能向两种方向演化：一是保持原模式的确定
性，二是向其它模式转化从而产生了不确定性。转换是随机的，随机变量旯和“分
别表示两种可能转化的概率。向两个方向突变的时间服从指数分布：
FAt)=1一e一“
G，(f)=1一P～，i=1，2,3⋯．n (7-14)
设11个企业所处的状态是独立的，当时刻t有j个企业交易不出现中断，整个
网络仍然能够连通。若有H一尽1个企业出现风险，整个网络瘫痪。那么，一个市场
将是遍历状态空间为E=(O，l，2⋯n．K一1)的齐次马尔柯夫过程。在平衡状态下网
络系统各个企业能保证交易的稳定解为：
p』=者孑!生』j=o，l，2，．．n．K-1 (7．15) 善南
从整个市场来说，市场是一个由交易链交织而成的网络结构。这个交易网络的
效率既与各个企业、产品质量结构相关，又与网络的结构相关。当网络内部是联通
的时，市场交易就不会中断。网络系统交易能够维持而不至于瘫痪的概率为：
尸：箩—箸L(1乌喾， (7_i6) ‘h—r一1 ’ 、’⋯，蕃南‘≯
这个概率比单链的大，因此它的稳定性提高了。换句话说，由于企业多样化后
为市场引入了替代性竞争通路，从而当一部分市场中断时，整个市场交易仍能维
持。不过，替代性企业的出现虽能保证降低整体交易风险，但是供应链之间的竞争
并未保证各个企业内部风险得到有效降低。因为许多不良特征仍可潜藏在模式包中
得以生存，既PJ一般不为0。
4)供应网对信息包内产品特征的保护功能
供应链积累的极端风险性可能导致整个市场交易崩溃。但是随着供应链阿络化
又会得到部分缓解，但网络化后会进一步降低对目标特征的选择强度和淘汰率。
设G是一个交易网络，由于网络内部有很多条道路可以连通，从而减少了对一
个链路的依赖，交易崩溃的可能性下降。也就是说，许多不良的交易特征会随着交
易网络的扩大而能得到有效的保护，而免遭淘汰。这就是类似美国安然公司这样的
大企业，由于信任关系导致内部不良行为长期得不到纠正从而使之在关联业务中积
累、传染，通过网络化过程扩大了初始选择错误，最终导致强烈冲击效果的原因。
不过这种保护与随机交易的保护功能性质完全不同。前者是交易者保持对市场遍历
式的搜寻，但由于搜寻成本与相应收益不对称而导致搜寻不完全性，从而保护了部
分不良特征；后者则是建立在对既有信息包信任基础上，通过把搜寻工作分散到各
个独立的经济主体来完成，不良特征只隐藏在信息包内。信息包交换是信誉经济时
期的普遍特征，它的这种内在缺陷构成了致使的威胁。
7．5主要结论及其意义
1)市场搜寻和选择是市场进化的重要保证。前者是基于新古典的个人或企业
的最大最小化优化准则的；后者则说明了群体选择下的市场进化趋势。市场的基本
进化方向是群体逐步优化，但如果信息是均匀分布的、特征不明显的话，这一过程
将非常缓慢，因而是无效率的。大市场随机或非随机交易都会因信息成本问题出现
一种稳定性，从而对一些不良企业或产品起了屏蔽作用而免遭淘汰。由于这个原
因，我们更应该认识到市场上的不良现象应该是市场交易制度问题本身所具有的，
且在进化过程中的各个阶段都会出现。
2)市场上的商品或企业都是一个复杂的信息包，它包含了许多交易信息。交
易事实上是信息包与信息包之间的信息交换过程。一个市场的整体优化过程需要决
策者搜寻所有的信息空间，但由于信息有限性、理性有限性和交易费用限制，我们
可以通过把交易过程分为一系列独立且相互依赖的过程让各个独立的经济主体来完
成。这样既利用了各个经济主体信息利用能力方面的专业化优势，又简化了交易过
程从而使整个市场得到优化。因此信息包式的交换应是市场进化中的高级形态。
信息包交换能大大简化交易过程。但它完全依赖于现有的信息状态(无后效
性)。由于任何产品提供的都是不完全交易信息，这为交易留下了大量的机会主义
空间，这使代理问题中的逆向选择和道德风险不能排除。而且更危险的是，由于不
是完全搜寻，许多不良的交易状态会得到保护而免遭淘汰，它会在交易链条和交易
网络中传染、累积，放大整个市场交易的风险性。
3)当信息均匀化分布时，不存在一种节约的信号机制指导消费者进行信息决
策，随机搜寻是一个节约机制。如果市场存在大量信息包，这些信息包是专业化厂
商替代消费者进行搜寻转换后的一个综合信息或一个简单的标签。例如，一张文
凭、一个品牌或交易所需的任何凭证。消费者按标签进行交易，这会大大节省个人
交易费用；从社会来说，也充分利用了社会信息和各种专业化优势。因此市场进化
到信息包交换阶段体现的是整体信息优化功能。
4)如果以上所称的“信息包”不能保证在最优路径上运行，那么整个交易网
络就会偏离最优化轨道。一些保证各个环节都能优化自身的信息能力的机制就会有
助于交易网络优化，这就是引入更多的信息管理和生产机构。例如，提高惩罚强
度、承诺、提高消费者选择的信息政策、竞争、信誉机制等都会有助于提高个体优
化动力，因此政府的增加选择强度的干预也是保证快速进化所必需的。因此，进化
到信息包阶段时，它是一种信誉经济的表现，因为包内信息的真实性无法通过解包
搜寻来解决。
华中科技大学博士学位．论文
8．1概述
8委托．代理网络中的策略选择与道德风险
委托一代理理论已经是分析各类经济问题的基本工具之一。随着社会分工、专
业化发展，经济主体之间的链状依赖和网络化成长是一个总体特征，这使基本经济
关系处于一种复杂的委托一代理状态下的博弈过程。从某种角度上说，无论是银行
系统、职业市场或交易过程，代理风险也已经上升为一种系统性风险。我们已经知
道，经济学家分析过各种可能的委托代理关系。然而在实际应用过程中却显得极不
自然。例如。一个企业本身是由众多参与人形成的合约集合，他们的独立策略选择
过程共同决定了企业的绩效。而且，许多行为人之间都存在着显性和潜藏的合同关
系，从而使委托代理链条不断延伸并联接成网络状拓扑结构。在这样一个以代理为
特征的委托代理网络中，我们如何诊断其中的系统风险与个体风险?如何分配组织
资源来修正偏离最优路径的行为?
在现实的网络一代理分析中，委托一代理关系并不仅仅局限于简单的二人关
系。它可能有单委托多代理、多委托单代理、多代理多委托等复杂类型
fHolmstrom&Milgrom，1991)。相应的，代理风险也不仅会仅仅出现在代理人一方，
也可能出现在委托人(Malcomson，1984)【821。现在的问题是，象股份公司的经理，
他本身就处于委托代理链条中的一环，它既是代理状态又是委托状态，它的行为应
该具有双重特征。对于这种问题的分析，过去的委托代理理论却束手无策。因此，
把委托代理关系扩展为一个委托代理网络并根据参与人在网络中的具体地位来分析
节点行为可能更加符合现实。
把委托代理网络化来进行分析的好处是：给定一个参与人集合N，只要符合收
益的可加性，双方就有可能合作，合同关系就有成立的福利基础；只要各方发生了
合同关系，他们就处于一个关系网中，每个参与人都是网络中的一个结点(nodes)，
而网络连线则代表双方之间的合同关系、交易关系等。在网络中，他们究竟是处于
委托状态还是代理状态，则由他们在网络中的具体情况来进行定义。而参与人的行
为则由网络中结构给定的讨价还价势力来决定。
经过综合考虑，作者认为通过网络工具来分析委托代理问题非常合适。原因
是：(1)处于网络中的参与人集(结点集)本身就是一个合作结构：(2)网络中各节
点分级独立决策又相互联通的特征极其类似交易的社会组织形式：既通过合同来联
结，通过讨价还价过程来决定组织绩效；(3)网络中的节点具有策略行为能力时，
将导致顶点的不同状态。这又是一个典型的委托代理问题。
建立一个网是本文面临的第一个问题。其中最困难之处是如何以网络形式重现
现实中的委托代理关系。网络理论是图论的一部分，最早用图来描述合作问题的是
Myerson(1977)。在它的文献中，网络是无向联通的。因此它等同于Shapely对N人
博弈中的联盟假设。后来，有许多学者深入地考察了各种可能的合作网络问题，如
有向、无向、混合网及树结构(Feinberg，1998；Johhnson&Gillis，2001)等。国内学
者也从资本、技术纽带探索结网的某些产业特征进行过研究(翁君奕，2002)。但
从他们研究方法上看，网络理论都依赖于图论的运算性质，只是依存问题不同而出
现不同建网规则而已。因此，本文不打算对这方面文献进行详述①，只是依照现实
中实际委托～代理网络成长过程确定自己的规则，然后用图论中知识来分析网络表
现问题。
当我们用网络来描述合作博弈问题时，首先必须解决网络的界限及成长问题。
本文假定在信息不完全环境下，通过几个特殊条件(信号筛选、参与条件和可加性条
件)来确定网络的成长过程和边界。从而使问题既符合有限理性、有限信息假定
(Simon，1976)@，又符合合作结构假定。信息筛选条件既是信号博弈的运用，又极符
合现实网络成长特征。在本文中，委托代理网络的成长规则为：委托人在几乎无外
部信息环境下，通过主动的信号发送来探索参与人集。如果符合筛选标准、参与条
件和收益递增条件，网络开始扩展。直到上述三个条件不再满足时，网络成长中
止，网络边界得以确定。此时，对于给定的网络来说，参与人面对的信息环境由无
信息转变为不完全、不对称信息环境。即，节点信息是完全的，但距离信息仍然是
不确定的@，显然这是一个不完全信息下的纳什网。。
网络边界既可以从成长的可加性确定，因而它是一个内生网络。也可以是从给
定网络中切下的子网，因而它是一个外生网络。一旦具体网络结构得以确定，它内
部的势力和策略选择则可以内生性的产生。只要我们估计出了参与人的势力分布，
那么道德风险问题便由讨价还价势力所允许的策略理性选择来预测。如路径选择、
制度选择、绩效控制和规模选择等。
8．2委托代理网络的定义及成长方式
8．2．1委托代理网络的形成与扩展
假设市场中有N个参与人，委托人‘∈Ⅳ有一业务磊(f)，其状态具有不确定
性。于是它开始主动探索可能的合作伙伴。设预期合作收益为v(‘，i：)，i：∈N—i。，
但它不知道究竟有多少人将参与，即，参与人都不具有节点信息和“距离”信息
。。他所能作的是，根据效益原则来探索可能的规模。于是：
1)它(i．)首先发出一个带筛选信号(如文凭、资本等)的广告信息圆。如果
信号符合单交叉条件(Sorting condition or Spence．Mirrlees condition)，它就可以根据信
号来设定不同的分离合同。根据显示原理(Myerson，1979，1881)，它将从带有满足筛
选信号(同于类型)要求的参与人中选择建立合同关系。
2)Ⅳ一‘中符合条件的参与人接受信号，意图与之建立代理关系。所有接受这
一合同人的真实产出水平不清楚，因而都具有相同机会。如果参与人既满足信号要
求同时满足参与条件，双方就联结为‰i：)。i i：∈N，即委托一代理合同关系确立。
3)代理人(i，)依照上面作法与其它代理人疗∈N一“，i：)，依次建立关系。
各个环节都要满足以下条件：(i)信息筛选条件。(ii)参与条件：
v．(f，，‘+，)≥瓦，i∈N；(iii)可加性条件(边际)：v(iU(f+))一“f)≥0。
按此方式，我们就可以把所有符合以上三个条件的参与人都吸收到这个委托代
理网中。
4)网络边界。如果上面的条件(iii)不再满足，委托代理网络终止成长，网络
的边界由此确定下来。条件(ii)不能满足时，代理人有两种策略选择，～是放弃进入
该网络结构，此时，我们说双方的合作解体了，或者说参与条件不满足。当合作收
益具有可加性时，我们发现他们进入了囚徒困境。因为每个人只能得到保留收益；
二是参与人不放弃参与机会，而是先进入合作组织，然后通过调整努力水平来平
衡，这就是常说的道德风险。在职业市场中我们能够集中的发现这一类现象。例
。网络中的参与人数量不确定假设是为了突出参与人是如何进入合作罔络的．这里距离是指由双方自我控制的变量，如个人
努力及其它策略空间．●终都可以压缩到成本～收益变量上进行衡量·
。在人才f订场或其它产业市场中，总有一方率先行动来探索合作可能性．因此合同要约一方都设定了一些条件：如资格证
转、资信证明等．这些条件在广泛意义上说．都具有筛选和甄别功能．通过信号来推断潜在合作者时·信号选择非常重要·
如，当没有更好的职业选择或～个职业虽然不能带来暂时的高收入但能够带来其它
效用时，人们总是倾向于先接受较低工资；条件(i)不能满足时，参与人会被自动筛
选掉，从而失去通过合作提高收益的机会。但代理人也可能不真实显示自己类型，
从而使筛选失效，这就是逆向选择问题。
5)网络建立起来后，设网络的结构状态依次为f(v。，q)。由于网络中总是存在
终极委托人与次级委托人，他们便形成了一个业务代理链条或网络(我们也可以用
生成树的方式分离出一个具体的组织形态)，于是整个网络中顶事件(终极委托
人)的状态F(v，G)可以由它的结构状态(代理人)来描述：
，
v(G)=v(U n X，) (8-1)
』一lft Df
其中，X=(xI，x2，．．．X。)，置=(0，1)是基本参与人集，当它在网络中时为l，否则为
0。此时我们发现，终极委托人的目标是通过各级代理人行为选择决定的。这种结
构方式有几种解释，一是当用网络连接时，它是一个图或者等价邻接矩阵；二是当
我们用合作博弈来表示时，它是一个不同联盟的特征值；三是当我们用来表示委托
代理网络时，它是一个合同联接的n人讨价还价问题。其中，初级委托人的状况都
可以通过代理人结构表达出来。这样，任何一个大群体博弈关系就可以由网络委托
代理关系等价表示出来了。相应地，个人选择(逆向选择和道德风险)问题也扩展到
了多人参与下的制度分析。特别地，任何复杂交易关系也可以用网络来等价表示，
不过期间的联结关系是交易中的讨价还价过程，也可以是一个不完全合同。
6)任何个人可以以各种不同身份建立网络，因而网络会爆炸式成长，从而把
人际关系扩充到整个社会空间o。例如，一个公司的职员可能同时在其它公司兼
职，一个职业经理人既隶属于某一公司网络，同时它又以同学关系、地域关系、血
缘关系与其它网络沟通。由于参与人在不同网络中的角色可能发生利益冲突，因此
组织的功能之一便是分离角色丛(role set)，切断不必要的网络外部联系。当我们
切断了它与外部网络联系时，～个有向图便转化为一个无向图。例如，当我们分析
企业网时，如果我们切断了它与所有者联系，企业内部人员(N人)就在网络内被
如果代理人策略性显示信号：如假文凭、假费信等．问题将非常复杂．一个替代方案是通过延长台作斯及接触次数来探索其
真实类型．所以企业都有试用期的作法．
1。1社会人同时具有多重角色，因而个人会同时处于多个并行网络之中．例如一个经理或政府官员既承担组织中规定的角色义
务．同时又处于血缘、地缘群体之中．网络封闭的目的是使参与人只保留组织中的角色义务．既纳什公理中的匿名性
(anonymit'／)假定(shapley．1953)．组织纪律的功能之一就是切断参与人与组织角色不符的外部联系．然而．目前中国各
类组织的封闭性并不理想，组织内个人角色非常复杂。从而使组织内部人际关系也异常复杂．
屏蔽起来了。此时，所有企业内部人员都将面临一个封闭的网络或组织，博弈网络
转入第二阶段一组织博弈囝。
8．2．2网络内部的讨价还价过阶段
在网络内部，参与人关联关系可以表示为：三：(Ⅳ)=“f，刘f∈Ⅳ，，∈N，f≠办
令S是图内的联通集合或联盟集合，则：s／G={i：i与j是在G内连通的联盟s}
此时，由于网络的边界是确定的，参与人就处于一个相对长期的互动环境中。
这些参与人对结点的信息是完全的，但对代表成本、收益、努力等“距离”信息仍
然缺乏或是不确定的。因此一个N人博弈过程已经转化为有限信息环境下的合作博
弈过程。它的典型特征如下： (1)网络内部可以保持经常的通讯联系，因而存在
环结构且是双向的； (2)它是一个相对固定的长期合作组织； (3)网络内部可以
有很多条通路(联盟)，它代表着不同的绩效水平，参与人可以策略性地选择。因
此讨价还价在内部经常发生。
确定网络代表着任何一个有形组织或联盟形态。它不仅是一个信息相对完全的
结构，而且是一个廉价对话机制，因此它是一个交易费用节约的环境。这在科斯的
《企业的性质》中已经清楚的论述过。不过，这里也引出了组织的困境，即：组织
内合谋问题、小集团问题等。
8．2．3委托代理网络中参与人状态描述与定义
1)如果参与人，有一引向参与人．，的箭线，那么说明i的目标是依靠．，来实现
的，此时f就处于委托状态；如果参与人f只有引出没有引入的连线，那么它就是
一个终极委托人；如果既无引出也无引入的联线，它就是一个独立的参与人；如果
某节点有引入的连线，那么它就处于代理状态；当i处于终结状态时，它就是终极
代理人；若i既处于委托状态又处于代理状态，它就是一个“内部人”。因为给定
委托关系，余下的网络优化问题由它控制，它通过“层层转包”直到终极代理人。
2)如果f有多条联线引入，它就是接受多人委托或并行委托的代理人，例如一
个股份公司经理，一个与银行、税收等多个委托人发生交易的企业等：如果它有多
条联线指向代理人，它就是多委托关系或并行委托的委托人。如果多个参与人依次
构成委托代理关系，它们就构成了一个委托代理链；多条代理链条相互交织形成了
一个代理网络。
。在本文分析结构中．把网络行为分为两部分的目的是：委托人总是主动探索可艟的代理合作结构t因而网络成长过程总是
从韧级委托人向终极委托人方向发展的．而讨价还价过程则是一个次缎缔造机制．它不新补充行为信息从而使筛选更接近真实
类型．删如，臆冀信息(逆向琏择问厚)可脆通过合作过程溜露出来．
8．3委托代理网络的策略空间
当把简单委托代理关系扩充到多人网络结构时，参与人的策略空间将会迅速膨
胀。即，它f司时由控制支出、支付变量扩充到规模选择、路径选择、组织选择、制
度选择和绩效控制等多个方面。因而诸如以足投票、地下经济活动、合谋组织等一
系列行为选择问题都应归入道德风险范畴。因为从终极委托人到目标代理人之间的
优化问题不再是一个由委托人控制的动态最优化问题，而是通过合同联结的代理人
分散执行的优化过程。在这种执行机制中，代理人就可能不选择委托人的最优化目
标。
8．3．1最小路与委托代理链条
Myerson(1977)认为，网络图可用来描述结盟行为并且证明其均衡解是夏普利
值(shapely value)。但值得注意的是。无论是夏普利值还是迈耶森值(Myerson
value)，都假设N人可自由沟通，各个联盟具有等概率形成机会下的均衡解。然
而，在委托代理网络中，联盟形成明显受制于图结构。
为了使委托代理链(联盟)适合于图分析，这里用最小路集来表示～个委托代理
链。其定义为：在图G中，设s是从‘，i：⋯j。和f。构成的一条链，若它满足：
(1)s是从i到f。。。的一条路； (2)从s中任意去掉一条弧线它就不再是一条路。
则s是从i到的f。最小路。最小路代表连接初始委托人到终极委托人之间的众多可
能的链条之一。给定该链条，从效率上看，任何参与人都是不可缺少的。否则该链
条将崩溃。因而在同一链条中的诸参与人具有同等讨价还价能力。
8．3．2邻接矩阵与委托代理网络描述
1)邻接矩阵：设网络G有n个节点，节点参与人关系可以表示为n阶矩阵
C=(c。)。，其中
c。：{o，称为网络G的邻接矩阵。它是对给定网络中参与人之间关系的描
F
述。式中x表示两个节点存在联系、通讯、友谊、合同关系等，也可以是经济流量
如成本、收益等。一般来说，它的具体意义取决于问题的性质，在本文中它由合
同来定义。
2)最小路集
华中科技大学博士学位．论文
定义：C：：(cP)。代表所有的2人关系，其中c≯：{乞％。-J≠。，这里，
’ fF ．．
【o，i=，
c，c。表示两者同时出现。若c≯1中某一项长度小于2，则规定该项取为0，这意味着
它不构成2人委托代理链条。这样，依上式定义的c。就表示从i到j的全部二人关
系．也即网络中的最小路集。
I’C1 ‘卜lJ
定义c。=(c∥)。，其中c护={备。p。口⋯，k=2，3，¨．H一1，同时约定c≯=c口。
【o，f=-，
在c?1=c。中，若代理链长度小于k，则规定该项取为0，因为它达不到最小
链的功能要求。若某项长度包含在另一项中，该项也为0，因为它是不经济的。由
于在n个节点的网络中，任意两节点最小路的长度不大于小1，故对邻接矩阵而
言，必有C”=0。若已求出C，C2，．．．C”’，则由节点i到j之间的最小路(或联盟)
全体为
卢=Σc： (8-2)
例如，当求得最小路集是{12，132，1432，14562}时，它意味着初始委托人l可
以通过多条途径建立委托代理关系，直达终极代理人2。每一条路径都代表一种可
能的业绩实现方案，方案数一共有4种，分别为l·2，1．3-2，l-4-3-2，1-4—5-6-2。由于在
每个委托代理链中，任一节点都是不可缺少的，因此各节点的重要性或讨价还价能
J3(Bargaining Power)相等。相应的，给定网络中各个参与人的总势力为在各个代理
链中的势力之和。
8．4不同代理网络结构下的讨价还价能力及行为分析
一个委托代理网络中涉及到一系列的讨价还价过程。由于这一过程的结果决定
于参与条件、讨价还价势力，一个非对称讨价还价问题(妒(，，v))的解将是最大化
广义纳什积的点(kalai，1977)：
妒(F，v)E arg max H(x．一玩)“ (8·3)
S，t x．一万>-o(．)Σn=l(ii)Σx．≥V(甩)(iii)
我们也可以这样考虑：任一委托人可以独立执行业务目标，也可以通过代理人
执行，但双方必须就分成比例讨价还价。两种选择的均衡条件是边际替代率相等。
因此在一个简单博弈中，令保留效用向量为玩=(0，0⋯O)：
筹象=l，从而解得：t=nΣt。
当把收益标准化后，如果联盟取胜，则Σ‘=l；否则Σ一=0。由此我们得
到：置=Pi
即，一个给定代理网中的均衡收益将按势力分配。由于作为个人，他是按边际
收益与边际成本(个人努力、诚实等转化的经济向量)相等条件来选择策略的，从
而势力可以直接用来衡量道德风险问题。因此代理结构中势力是诊断代理风险的一
个重要指示变量。只要我们求出了势力，问题便迎刃而解。
从上面的网络邻接矩阵可以看出： (1)每条最小路都是一个代理链，我们也
可把它看作是～个取胜联盟且是极小联盟(Minimum Win Coalition；MWC)； (2)
每个委托链条或MWC都有相等的形成概率； (3)在每个WMC中局中人平均分
配势力；因此，它是一个简单多人对策问题。
在一个N人(N，爿)个简单对策中，对每个局中人f∈N，定义
卢(j)={S∈／．tli∈s)。卢(j)恰好是包涵i的MWC的集合。相应的对策中i的势力定义
如下；
胪南。蚤，两1 (8。4)
它是一个人在各个代理链中的势力的加权和。下丽我们来对可能的各种代理结
构进行势力估算。
8．4．1单链委托代理过程中的势力分配
如果N人处于一个相互依存的单链委托代理链条中，如图(8—1)所示。那么它们
将均分其势力。在这个链条中，定义r=(N，∥)为N人博弈结构，N=(1，2，3)为参与
人集合。因为各个行为人是通过串联连接的，所以委托代理链为u={123}，相应地
各方均衡势力为：p={1／3，1／3，1／3}．即势力均等分配。一般地，一个N人的单链委托
代理关系中个人势力为P，=i1。
(了◆O弋9
图8-1一个单一代理链条的势力分配图8-2并行委托或多人委托
9
华中科技大学博士学位．论文
8．4．2多人委托或并行委托结构
如果一个代理人同时接受多个不同的委托人委托时，它就处于多委托或并行委
托状态。这种委托结构在现实中并不少见，如纵向一体化产业的上游处于竞争状态
时、大商场的供应商、股份公司内部的委托代理关系都是这样。我们假设存在图(8．
2)式的并行委托结构，那么N={1，2，3，4，5)，∥={145，245，345}．此时势力结构变化为：
p={(1，1⋯1 3 3)。显然，多人委托提高了代理人势力，它的讨价还价能力和道德风险
空间都上升了。
8．4．3多代理多委托
在图(8．3)方式的委托代理结构中，一个代理人既接受多方委托，同时自己又是
委托人，通过多人来代理自己目标。现实中许多交易、组织具有这种结构。其参与
人集N={1,2，3⋯7}．。u={145，146，147，245，246，247，345，346，347)。其势力分布为：
p={(1，1，1，3⋯111)。即，在这种结构中，由于上游有委托人竞争、下游有代理人竞
争，结果使网络势力向中间代理人集中。上面的网络结构是众多多代理多委托结构
之一，在它的一系列变异类型中，势力分布取决于网络结构。
8．4．4多人委托中的加权：简单加权投票
上面我们假设的多元委托人是独立的，且具有同等势力。然而委托人不独立，
且权数不相等，那么当委托人有相互冲突目标时，该会引起什么结果?下面我们以
一个股份公司来说明。一个股份公司股份分配在不同的参与人手中，拥有的股份份
额被称为权数。因此该对策是～个简单投票加权对策：[g：wl，w2，．．．，％】，这里有n
个局中人参与投票过程。Ⅵ是第i人手中的票数，或权数。设N=(1，2⋯n)是所有
投票人的集合，N的一个子集s为投票人组成的联盟或集团。如果一个联盟能赢得
一次表决，则称其为取胜联盟。衡量加权投票对策势力一般用Shapely-Shubik值
f1954)和Banzhafl’1972)值。即，当用投票来解决冲突时，联盟会出现。我们在后面
的案例中将详细分析这一问题。
8．4．5委托人处于代理状态和终极代理人势力过于分散
在一般委托代理问题中，我们总是假定给定的委托人都是终极委托人。但是，
如果委托人既处于委托状态又处于代理状态(如国有企业)，或者股权分散在众多的
委托人手中时(如基金、国有企业)时，将会出现什么后果?在图(8—4)的委托代
理结构中，代理人1就处于无数委托人的“海洋”之中，但每个人的力量都太小。
华中科技大学博士学位．论文
在这种委托代理结构中，其势力分布为：p={{，{，击，．百1)。显然，当人数为无限多
时，委托人的极限分布是他们都变为哑元(势力为O)。
处于这种方式的代理人l的行为是极其奇怪且又合情合理的。因为在这种结构
中，该委托人行为必然表现出两面性。由于远离终极状态、终极委托人不确定或过
于分散使它更接近为一个“独裁者”，当它与代理人谈判时它就行使委托权：另一
方面，为了有效控制下级代理人行为，它又会通过扩大委托空间来分散代理人势
力，从而保证内部控制的有效性。此时，它放弃委托人目标，任由机构膨胀。
8．5委托代理网络中的策略选择
从上面分析中我们可以看出，如果委托人与代理人之间目标是激励相容的，代
理人执行个人优化目标将导致委托人目标得到优化；然而，如果在信息不对称环境
下代理人得不到足够的激励时，双方目标将会出现冲突，具有优势的参与人会策略
性的选择自己的行为来补偿预期收益损失，从而出现一系列扭曲现象。。归结起
来，网络中代理人道德风险主要由(8-5)oPIt,个参数决定：
只(v，p)∈argmax(rain)l l(v。(G．，N，∥j，s．，xf)一玎(．))9 (8．5)
二N一
(1)网络(G)选择：即，代理人选择最大收益的网络加入，而不是忠实于某
一固定的组织： (2)网络规模选择(N)。(3)结构选择(∥)(4)路径选择
(s)： (5)流量控制(x)。最终结果则由各方讨价还价势力决定。下面我们用
一个案例来说明这种网络的策略选择过程。
8．6案例：国有企业的策略选择
国有企业是世界许多国家企业结构形式之一。在我国，宪法规定国有企业的财
产属全民所有。从所有者到最终绩效的实现是由一系列委托代理链条决定的，又通
过各种途径扩充为一个网络结构。
群峰一熟一燮一一一～一鬻i|l 臻浆觚一瓣一辫里
8．6．1国有企业的虚拟形式
如果把整个社会看作是一个大网络，我们截取一个子网(如图8．1)来虚拟一
个国有企业。其参与人与联结状态可描述如下：该网络的终极代理人一全体人民一
可以被看作是一个海洋，每个个人只占非常小的股份。虚拟的参与人一政府一作为
一级代理人，企业领导是二级代理、三级代理等。显然，处于中间状态的参与人同
时具有委托人和代理人的双重特征。下面我们来分析策略选择及代理风险问题。
8．6．2策略理性选择、讨价还价形式与道德风险的各种类型
1)行为两面性：守法与腐败
腐败是世界共同面临的难题，在这里我们把它看作是给定制度(网络结构及
其分配规则体系)下参与人的讨价还价方式之一。在一个具有监督和惩罚机制的环
境中，腐败行为的收益可以转化为等价的风险收益。如果存在可预期的激励和约束
机制，自我选择和外部压力将使其替代掉这些行为方式。但是，腐败行为是否最终
出现，并不仅仅在于腐败所体现的个人对支付的追求，关键还取决于它是否处于具
有讨价还价能力的网络结构中。如果网络结构给予了参与人的足够势力但并未得到
与之相符的支付，策略行为及替代选择将导致参与人转入各种稀奇古怪的“地下活
动”。但是，由于委托人策略选择能力也受势力约束，当他放弃参与时，正式组织
崩溃；当他行使监督、投票权力时，代理人将面临惩罚。因而，代理人在进行策略
选择时，有时也会把委托人目标纳入自己的策略函数中。从而使代理人行为出现两
面性：即他同时具有委托人和代理人特征。
设博弈为F=(Ⅳ，∥)，其中N={1，2，⋯，n}．p={In，2n，3n⋯O一1)n)，(1，2，⋯，
(n．1))i是委托人形成的海洋，它们之间不能有效沟通并形成一个投票联盟。n代表
代理人。在上图中，其势力分布为：P={n，P：⋯P，}={{，采可⋯积可)。它意味着
代理人始终有50％势力。
(i)势力分散下的单级代理
假设委托人(产权所有者)之间可以沟通且能形成投票联盟，当票数超过一定
限额时他们就能行使否决权。因而它是一个加权投票对策。如果取限额q=51％，我
们始终分配q／2给一级代理人。因为既然是国有企业，国家将作为代理链条中的一
环且均分投票权。于是问题转化为一个大参与人与众多小参与人之间的博弈问题。
Amnann and Shapley f1974)已经证明，这种类型的投票系统的势力分布为大参与人
具有完全势力。即：
[q：WI，W2⋯Wn】_【51％：爿而，赤，．．．25．5％】
一华中科技大学博士学位．论文
。。222。2222222===============三== ；
吼=10．5产l=l一赤．当"。。，吼：舰(1一赤)一，
或者说，大参与人是一个独裁者(纪=1)，而其它人都是哑元(dummy)
(纪=O)．
(ii)势力分散下的多级代理
图8_4一个虚拟国有企业
如果政府(一级代理)把任务委托给企业领导(二级代理)。那么它的势力分
布为：
F=(Ⅳ，∥)，其中N={1，2⋯Il'n+1)，(n+1)代表经理。当n—m时，顺次连接的代
理人各占l／3，而剩余l／3势力分散到其余众多参与人手中。于是投票对策转化为：
[q：wI，W2⋯"Wn】_【51％：号{l⋯2．n一1)，{，蜘
从上面分析可以看出，如果政府与企业合谋就足够操纵该企业。在许多公布的企
业腐败与政府腐败案例中，我们发现二者高度关联，这里能部分得到说明。
在这两个大参与人与众多小参与人的博弈中，其均衡势力分布为：
‰=({(⋯)，{，{)。
因此，双方的势力都下降了。其原因不是很清楚，但从企业或政府行为中发现
它似乎是真的：企业或政府中的腐败者都声称为所有者谋利益，且能诚实纳税、增
加就业、热心公益事业、虚报业绩以获得信任，同时又以各种手段以权谋私。
2)机构膨胀过程
组织机构膨胀不仅仅存在于国有企业，任何组织都存在类似的问题。下面我们
来重现这～过程：在图(8-5)中，参与人l是一个终极委托人，它与外部委托人之间
的联系已经切断。l的目标是通过授权(委托)给{3，2，4)来完成。由于它竞争性地
引入多个代理人，它的势力将相应提高。代理人为了维护自已的地位和强化对下级
的控制，它会模仿委托人，也建立一个冗余系统。
圈8-5一个虚拟科层组织结构图
现在来分析图8-5结构的势力。定义博弈r=(N，∥)，这里N={l，2，3，4，5，6，
7，。
∥={12，13，14，125，126，127)，∥I={12，13，14，125，126，127)，∥2={12，125，126，127}，
／a3={13}，∥4={14}，u5={125}，∥6={126))，／a，={127)
(i)首先考虑鸬=(I，<2，{5，6，7}，3，4))，它的势力分布为：
P2{Pl，P2，P3，P。，Ps，风．P7)={2-,{，击，击，古，古，古}．
(ii)如果我们切去子集{3,4，5，6，7)，它意味政府将仅仅选择{1，2)建立合同关系，
因而
P={岛，p2)=皓1，劳I．既双方均分势力。
(iii)如果子集{5，6，7}被'0J-去，我们得到{1，{2，3，4))，于是∥={12，13，14}和
P={一，p：，P，，P．}={{，吉，{，吉)．
(iV)如果子集{3，4)被切去，其势力为：p={n，P：，P，，风，岛)={{，{，{，；，{)．
对于每个参与人，它的选择是最大化自身势力的结构：max(N，向(麒))，iE N，从
上面分析可以看出，一个理性的参与人总是有动力去扩张下级结构从而提高自身的
市场势力，即，只(“‘)∈argmax(N，只(“))。其结果是组织总是扩张到最大空间，
这也是组织结构总是分布式的原因。
3)路径依赖性质与内部人控制
从上面的分析过程可以看出，委托人目标需要经过一系列代理人理性选择过程
来实现。与委托人动态最优化问题不同的是，网络中的优化过程总是分散执行的，
缺乏中心机制。因而每一步都可能出现参与人的策略选择问题。这样，一旦委托人
授权代理人执行自已的目标，余下的网络优化问题都将由代理人控制。这就是常说
的路径依赖性质回，因为决策往往具有不可逆性。
。委托人也可以实施动态监控来保证代理人运行在量优路径上，然而这种监控也是昂贵的．当监控成本高到使任何监控行为
都是无效率的时，监控是不经济的．这也就是为什么委托代理过程被广泛引入多人合作，同时通过擞勋途径来兼容硬方目标
的原因．
给定一个委托代理博弈结构(Nf)，存在许多种业绩状态。各个状态依存于代理
人的选择。如果信息是完全且无成本的，初始委托人就可以优化整个路径：
max(min)Z=Σ(Z) (8—6)
fcl
然而，委托代理的问题总是处在不完全、不对称信息环境下。因而它的优化决
策过程被离散化了。在这个非集权体制中，优化决策行为独立地发生在每一阶段，
由代理人控制。并且下一阶段的策略选择将影响上一阶段到终点的路径。如果参与
条件与激励条件能动态地得到满足，根据贝尔曼优化原理(Ballman,1953)，分散
优化决策能达到整体最优效果。否则，由于逆向选择与道德风险作用，代理人只优
化(max(min))自己目标而不管整体最优性能。令zf代表决策阶段。t=l，2⋯c阶
段的逐层内部人控制过程如下：
max(min)Zj=ΣZ?
r}l
z’2 e argmax(min)Z2=Σ彳
t=2
Z’Ⅳ-l∈argmax(min)Z¨=Σ彳
f。c—l
即：在第一阶段委托人把业务委托给下级代理人，那么从终极委托人到终极目
标的路径就分为两个优化问题，委托人只优化他到与之直接相连的一级，余下路径
则由代理人控制；第二阶段，代理人再作为委托人把业务”承包”给其它人，如此逐
级委托。结果，初级委托人状态就由一个优化问题转化为多级优化问题，依次直达
终极目标c阶段。各个阶段通过合同联结，其讨价还价解为：
zf。Ⅳ∈argmax(min)兀z7‘“’ (8—7)
显然，如果参与激励条件都能得到动态满足，整个分散优化过程将执行总体最
优目标。然而，当合同支付不能达到与势力相当的水平时，他会因优化自己目标而
使委托人希望落空，其偏离程度由讨价还价解给出。即，势力决定了路径策略选择
和道德风险水平。
8．7机制竞争与合谋组织
上面分析的代理结构都是一种常规结构：树结构。在这种结构中，我们只考
虑了组织内正常的权力传递规则，而由内部通讯导致的诸如合作、合谋等则排除在
华中科技大学博士学位．论文
外，即不考虑网络内部的环结构。然而，一个稳定的组织环境本身是一个“廉价对
话”机制，它极易导致内部人之间的勾通通讯，从而探索到更好的支付结构，即，
环在组织内部是广泛存在的。我们医疗组织中的合谋问题(蒋天文，樊志宏，
2002)就是一个典型的带环合谋结构。从该案例可以看出，当子网络与大网络出现
目标冲突时代理人的策略理性选择过程。而寻找该子网(合谋组织)并估计其势力
可用上面的最小路方法；其行为分析类似路径依赖与内部人控制分析过程。下面我
们分析制度竞争的几种主要形式：
8．7．1对制度的投票方式(一)：以足投票
当结点的参与条件和激励条件不能满足时，参与人可以放弃进入该网络。此时
我们说他不再参与该合作结构。资本、人才在区域间和国际制度性流动已经证明了
这种对机制投票过程的广泛性。例如，一个区域在吸引资本和人才时，由于决策是
建立在参与人自我选择基础之上的，因此区域内的政府总是通过提高或保障参与人
的收益这一途径来提高参与人进入的积极性，其政策包括投资补贴、税收优惠、公
共服务、工资政策等来调节预期收益变量，成本变量，风险防范等，其结果仍然是
调整参与人的支付水平。为了简单地分析这一策略的宏观效果，我们用交易次数、
节点数、网络崩溃风险等变量变化来模拟它。在一个交易网络中，以足投票过程事
实上是对一个交易系统的规则选择过程，也是对一个交易机制的选择过程。
1)交易次数：一个n人委托代理网络交易次数为／'Ix一。如果i放弃参与，i节
点消失，与之相关的结点都将消失。所以交易次数就减少为0一／)2 fE疗。设交易
规模为s，则交易减少量与参与人数平方成正比：S=o(n2)。显然它不是简单的线
性关系。
2)制度风险：参与人减少可能导致整个交易网络崩溃，这就是网络风险问
题。其崩溃规模既可以是微观的也可以合成为宏观效果。网络风险与网络结构相
关。
设n个参与人是处于离散选择状态下，用矿(x)表示网络所处的状态(O，1)，前
者代表网络崩溃，后者代表正常。P。为i退出该网络的概率。假设如果有j个参与
人放弃参与，交易制度将能得以维持， (j=0，l，．．．n-k)，此时，≯(x)=l；若仅存在
n．k+1个参与人保持在交易系统中，网络崩溃。则系统风险性可依二顶式定理得
出，其网络不崩溃的概率为：
华中科技大学博士学位论文
k
p=Σc。kp，’(1-p，)⋯，当肝寸00时，根据中心极限定理，可以用正态分布来
i=n
求出系统的风险状况。因此以足投票是当参与条件和激励条件不能满足时，参与人
对网络(制度)的投票方式之一。这是一个“达尔文”社会选择过程①。
8．7．2制度投票方式(二)：合作和内部合谋组织
我们常见的是，参与人不经常“以足投票”，这既与外部机会收益有关，更重
要的是，一个参与人的讨价还价势力往往依赖于给定网络(或组织)中的位置。一
旦他不再是网络中的关键人(如医院中的医生、企业经理或行政职位时)，依存势
力也随之消失。所以当参与人满足参与条件但不能满足激励条件时，参与人宁愿在
网络内部探索联接的可能性而不是放弃成为“结点”机会。且参与人可能具有多重
身份，因此这种探索还会超出网络边界，与外部结盟。参与人在内部重新结网是为
了获得一个与势力相当的均衡收益，因此它是对制度投票的一种形式。即制度选
择。
设N人组成的一个网络G，它的分联盟形式都可能形成，它可以形成
cj，c；，c；，．．．c∥个分联盟，因而组织内人际关系、合谋类型是异常复杂的。给定
参与人在c：网络中的位置，因而势力是给定的。于是参与人最优决策是，在不同的
网络之间或子网进行探索、选择．设各种子网络给参与人分配为：v．(G。一。)，则：
I)组织内合谋：／∈argmax(min){v(G1)，vCG2)，．．v(GⅣ_1)，v(GⅣ))，Ups,择合谋组
织中的关键人结子网国，最大化自身效用或支付。
2)产业间合谋或合作
设网络G。=(Ⅳ。，∥。)和G2=(Ⅳ2，／J2)代表两个简单对策。定义：
G。^G：是一对策，局中人集N=NI nN：，取胜是指在Gl，G2中都取胜。即一
个参与人可以同时充当两个网络(组织)中的关键人；
G，vG，也是一简单对策，局中人集Ⅳ=ⅣlnⅣ：，取胜是至少在GI，G：中都取
胜。
根据Dubey(1975)的合成公理，局中人i在Gl，G2中的势力之和应等于在
G，^G，和G。G，中的势力之和。即：
。值得注意的是，s印n∞(1973】式的逆向选择也是“达尔文”机制之一．在网络中的“地位”也是势力的重霎誊夔，对于母
些具有高生产牢的参与人主要。以足投票”方式进行逆向选择；然而一个经理、官员等似乎更倾向于道德风险选择-因为它
的势力严熏依赖于组织环境．勰鬣箍渊僦hu。6i⋯k,1954是)茸黛僦慕勉蒺酬鬻絮警乏箩为炎键人．例如在医疗系统台谍中。药剂科是一个关键人·但合谋组织中不需要党舟、上苦碍鄙l J誊匈t’E她一l’嚏7‘
k，(G1)+k，(G2)=七。(Gl^G2)+t(Gl VG2) (8-8)
k表示的一般的势力指标。
从中可以看出，一个具有跨组织选择能力的关键人的个人选择问题是，它不
仅在两个组织之间选择最大化个人势力，而且他还跨网络结网。如果跨产业是正强
化的，如共享专业化优势，它是一个典型合作博弈问题；然而他选择与网络目标不
兼容方式结网时，它可能是合谋组织。我们分析过的医疗合谋组织是一个典型合谋
组织，医药代表同时在两个产业之间讨价还价。对于合谋问题，网络Gl，G，的目标
是尽量令七．(G。^G：)等于0，而参与人的目标则相反。两个冲突目标之间的互动有
几种解决方案：一是通过监控过程限制合谋；二是通过激励来引导代理人选择放弃
合谋：三是尽量引导合谋向合作目标转化，使“地下经济”自动消失。由于具有势
力的参与人具有在不同网络之间选择的自由，于是一切问题都转化为网络之间、网
络分配制度之间的竞争。
8．8结论
1)按合作博弈的规则，复杂委托代理关系可以转化为一个网络结构。因而初
始委托人的目标通过代理来实现的过程，可以等价表示为图中的顶端事件与结构之
间的关系。
2)通过把一个委托人优化决策离散化为一系列代理人策略选择过程后，每个
节点都代表一个理性参与人，它相对独立地策略性控制绩效。如果动态激励与参与
条件不能满足的话，代理人将会出现一系列异常行为特征：合谋、内部控制、机构
膨胀、腐败等，出现这些代理风险现象都是代理人讨价还价方式。然而，这些行为能
否实现又取决于委托代理结构特征。一种有利于讨价还价能力的结构将会引起预期
行为出现。
3)代理人策略选择主要在几个方面：一是制度选择，如合谋、组织扩张等。
其目的是探索最大势力的网络结构和给定制度下的最大收益；二是绩效控制，即通
过自身策略选择控制网络绩效。三是路径控制。四是规模控制。五是结构的控制。
4)代理人偏离最优轨道的任何策略行为都是更广泛意义下的道德风险。然
而，讨价还价势力限制了代理人行为的任意性。其当支付大于讨价还价势力给予的
均衡支付时，分散执行过程等同于委托人的动态最优化问题。此时，相当于代理人
完全执行委托人推荐的目标，道德风险行为消失。
100
9小世界网络及“谣言”的预警功能
在进化层次上，一种非常有利于信息传播的网络结构就是小世界网络，从而导
致了小世界现象。本部分重点考察多人互动的结构选择问题。很显然，在社会经济
的联系方式中，小世界网络普遍存在，并且是传递外部冲击的重要途径。
社会、经济对对外部冲击的响应动力学模式与它的组织结构高度相关，也与个
体行为选择有关。过去，人们在认识经济增长、产业布局、宏观经济波动、传染病
医学等问题时，大多是把经济整体看作是均匀的，相应的模型也就建立在随机均匀
网络基础之上。然而近年来的研究证明，无论是自然系统还是人工系统都具有小世
界网络特征。这一结构特征促使人们从不均匀角度修改自己的模型。
本文利用小世界网络理论，结合目前中国发生的传染病案例进行了相关研究。
结果发现，一些备受谴责的群体行为，如谣言、恐慌等都与小世界现象有关。不同
的是，在缺乏“临介值”前提下，群体的过度响应能够起到预警作用。群体行为的
典型代表就是谣言，在特殊情况下，谣言将会触发两个预防机制：一是它以强烈的
响应方式，放大了初始冲击。从而使政府被迫提前介入，干预“传染病”的传播过
程，促使社会理性的早日恢复；二是从微观基础上，个体预防措施的激活使社会具
有了“群体免疫”能力。因此，一定程度的社会过度反应不仅是必要的，而且可能
是非常经济的。
9．1前言
社会恐慌、谣言流行、金融危机等现象都是类似“传染病”一样的群体行为，
这导致人们从传染病动力学特征来认识它。“传染病”的一般传播动力过程是，面
对一个初始冲击，通过网络中的节点(企业、个人、计算机等)联系开始传染，最终
合成为一个巨大的冲击效果。然而，社会经济系统经常会面临各种随机冲击，但真
正能形成像“传染病”、“社会传染病”一样的情况并不多见。一般来说，任何传
染病形成都与两个因素有关，～是基于个人选择的群体行为学基础，其次是群体之
间的联结结构。只有当社会节点处于非合作状态，并且有一个利于传播冲击的结构
相依存时，传染才具备大暴发的条件。
网络连接和网络外部性不仅是自然界的基本特征，也是社会经济的共有特征。
在这个网络中，节点一般是指政府、企业、个人、计算机等“参与人”，而这些个
人又通过交易关系、社会关系相互连接，从而产生随机关联。相应地，网络行为就
10l
由它的微观基础一参与人一的理性选择来决定。网络是合作的另一种结构性描述，
只要某人还处于网络节点位羲，它就是合作博弈中的参与人。因此，过去人们总是
认为，网络合作会导致“帕累托”改进，“焦点均衡”是由收益占优来决定的。但
是，自从Harsnyi和selten(1988)【83】定义了“风险占优”概念以来，人们开始关注合
作收益中的风险对个人策略选择的影响，后来的大量博弈实验也证明了这种担忧。
因为在面l晦熏大外部不确定性时，参与人行为总是收敛到次优选择。即，“焦点均
衡”可能收敛到收益占优，也可能是风险占优的。这与一再出现的金融危机、谣言
和传染病引起的恐慌现象相一致。
从社会互动结构上看，在某些特殊条件下，个人选择将会合成为群体一致性行
为。这种结构能够快速强化人们的预期，从而导致加速传播过程。这一观点也是近
几十年现代宏观经济争论的焦点。例如，新古典学派从预期的加速模型证明了经济
内部的不均匀传导机制，新恩斯学派则认为经济内部存在一种把这种冲击扩大化、
持久化和制度化的机制。总之，经济内部的响应模式存在时间、结构上的不均匀已
经引起了重视。本文将同时考虑两个方面：网络微观基础的行为模式和网络结构模
式。
9．2信息传播与传染病传播的网络特征
自从Milgrom(1967)[“】提出了“小世界网络”概念以来，该理论一直吸引着不
同学科人员的交叉研究活动。得力于计算机和数学家努力，到上世纪末期，人们已
经比较清楚的认识到了它的基本数学特征，并在社会学、传染病医学、计算机科
学、自然科学等领域得到部分检验。它们不仅在各自领域内都发现了小世界现象，
而且进一步认为，它是自然系统和社会人工系统的稳定进化特征。当Watts和
H．Strogatz(1998)在《自然》杂志公布了研究结论【85】以后，它迅速引起了其它学
科的兴趣，相关文献也随之暴发式增加，其中，经济学、社会学、计算机科学以及
传染病预防学是重点领域【8¨11。它的理论和实践意义在于，所有大群体的结构状况
对响应外部冲击的模式，可能都与小世界网络相关。因而它将是一个崭新的认知线
索。
金融危机、传染病或任何重大的冲击(意料的或未意料的)，总是出现两种伴
生的群体现象。一是冲击的自然传播过程；二是社会群体行为的传播过程。后一过
程往往会扩大、持续化初始冲击，从而加剧波动并造成次生灾害。所以我们一般是
从负面影响来评价它的，认为它是非理性的、操纵性的和有害的。很少有人从正面
角度来认识它。为了认清这一现象的性质，我们从小世界特征开始。
设某一群体内部互动人数为n，在网络中它就代表n个节点。每个参与人(v)(节
点)随机的与外部发生关联，节点联接关系为k，，它代表节点v与K个近邻节点之
间是直接联通的。任何两个节点之间都可能通过中间节点保持联接，期间的亲密关
系可以用最短距离d(i√)来表示。节点平均路径长度被称为特征路径距离
(characteristic path length)；另外，设P代表某一节点与外界产生的随机关联概率。
那么，我们就可以用连接密度系数G(clustering)、平均特征路径长度上和随机关联
概率P将网络分为典型的三类，即：随机均匀网络、局部网络和小世界网络。
1)如果H>>k>>In以>>1，那么，几种主要网络的特征如下：
当随机外部联系接近0(Pa0)时，上zn／2k，C*3／4。此时，各个网络之
间由于缺乏联系，整个社会就变成一个个“孤立”群落，但局部具有很强的聚集
性。在自然经济时代，地理隔离和社会隔离导致的自给自足经济就是如此。此时，
各个村落内部构成了一个紧密联系的网络，但村落之间“遥闻鸡犬之声，老死不相
往来”。显然，任何冲击都不会对外部网络产生影响。
如果节点之间具有确定的联通路径，即P“1。此时三。clll玎／Ink，C∞kin，这
种网络具有最短特征路径，但聚集性差，因而它是随机均匀网络。在这种网络中，
任何节点都可以直接联接，不需要“中心”。你可以直接与伦敦的客户联系，而不
是通过中心代理人发生联系。由于它的近邻节点不密集，因此传播效率并不高。
当随机联系概率处于(0．001<P<O．01)之间，路径长和节点密集系数为
L*Inn／ink，C*3／4时，它就是一个小世界网络。这种网络同时具有局部网络的高
聚集密度和随机网络的最短路径。因此，一种冲击今天在这里“冒出来”，明天又
在那里冒出来。一旦冒出来后，它就利用节点密集特征，“哗”的一下传染到所有
近邻节点，这就是它的不同之处。
2)节点密度(联通性)服从指数分布律
在过去经济学及相关模型中，一般假定节点的联通性应该是随机正态的。但
是，在小世界网络中却具有无比例特征，没有钟形曲线。目前所发现的普遍特征
是，个体联通概率符合指数分布率：
p(七)aC k7
p(七)是节点存在与其它k个节点连通的概率，它一般在2<Y<3之间(Barabasi
&Albert，1999；Dorogovtsev，ets，2000；Albert&Barabasi，2002)．这意味着某些节点保持高
度的密集性而另外一些则是稀疏的，一些关键节点如互联网中心、企业、人群具有
比其它人更容易传播外部冲击。不仅如此，研究者还发现新加入的节点总是选择与
已经非常密集的节点联结。因为通过这些人的“中转”后，会大大缩短与其它人的
“距离”。演员倾向于与名演员合作、学生聚集在名师麾下、权势人物社会关系不
断成长、小企业乐于成为著名大企业的“业务伙伴”、人们总是向中心城市流动
等，都证明了这一结论：节点“马太效应”。
3)抗打击能力或生存能力：所谓打击，即摧毁某些节点或联边，使网络节点
之间不再保持联通。不同的网络结构具有不同的抗打击能力，或者说生存能力不一
致。对于随机打击(如传染病预防、经济波动的干预)来说，小世界网络与随机网
络都具有很好的抗毁性。但是，对于智能打击来说，由于干预者了解网络的结构特
征，一些重点节点或联边将会受到重点打击。因此它的抗毁性较差。
在小世界网络中，当我们不加选择的切断大部分节点后，它仍然能寻找到通路
保持连通性，并再一次利用聚集特征引起传染。但是，它的节点联系密度的概率分
布使它特别容易遭受到“智能”打击，因为只要小部分“枢纽”节点和外部联系，
就能使网络不再保持联通性。
从以上三个特征我们可以看出，经济波动、谣言传播及流行性传染病动力学特
征与网络结构关系非常密切。
9．3“传染病”与“社会传染病”动力学
9-3．1传染病动力学
小世界理论的重点应用领域在传染病预防医学上，而传染病模型所体现的群体
行为目前也被金融领域所借用。在本质上，传染病的传染机制的理论基础是为所有
群体行为模型所共享的，如谣言传播、经济增长等。因此，认清传播网络的结构基
础将非常重要。
1)均匀传染与传播过程
长期以来，指导传染病预防医学的理论基础一直是建立在SIS(Baily，1975，
Diekmarm＆Heesterbeek，20001蜘)(易感人群．带菌人群．健康人群，Susceptible—
Infeced．Suscaptible)和SIR(removed)模型基础之上的。这些模型由于都只考虑传染的
均匀分布特征，因此可以认为它们是面对一个均匀网络来建模的。其动力学方程
为：
!!孥竺；一po)+A(|j})p(，)【1一po)】(9．1)
at
p“)为时间t的感染人数。当不考虑网络内部的联接紧密程度时，所有节点被
感染的可能性是相等的。式中第一项代表被感染者将以单位系数转换为健康者；第
华中科技大学博士学位论文
二项代表新感染的人数，它与传染率A(女)，联接概率和新传染概率(1一p(f))成正
比。在(9—1)式中令皇窒掣：o，得到均衡解为：
当旯<以时，P=0
当五≥五。时，P=1一每。其中，乃是相变的拐点，它代表的意义是传染病在
l临介值附近的异常行为。当感染人数低于这一数值时，它将会以指数方式消失。只
有高于这一临介值时，疾病将会暴发。因此，它为传染病或类似传染病的经济现
象、社会现象提供了一个线索，即通过观察临介值来确定相应的干预政策。低于临
介值时， “传染病”将会逐渐的自动的消亡：高于临介值时，我们必须进行干预。
这就是我们长期依赖的理论基础。
2)不均匀传染
但是，当我们考虑到人群联系的不均匀特征时，SIS模型可以被改造为：
!!笔兰2：一Pk(f)+Mop(f)[1一凤(f)】o[PI(f)】(9．2)
上式第一项与(9-1)式第一顼代表的意义相同。在第二项中，病人将以1一凤(f)
概率对健康人群感染。其传播效率与传染率旯(七)、结点联通度k和概率的偏导数
O[pk(r)】成正比。它的均衡解为：
n=害淼。经过一系列复杂运算后得出传染率的分布为：
P～2e一‘7“，
显然，它不存在拐点或者“l临介值”问题。如果我们面对的是传染病、经济传
染病和社会传染病，我们发现，一个具有不均匀内部结构的系统会出现暴涨骤落特
征。我们无法利用l|缶介值来进行预防决策，因为只要还有很小一部分“病例”存
在，它就能够通过小世界网络中的密集节点大量传播。这为我们用一般的统计指标
来监测并预警类似动力学过程提供了反面证据。
9．3．2谣言传播动力学过程
谣言是一种社会现象。但“无风不起浪”，它能够利用某种机制把外部冲击转
化为群体行为，从而扩大、歪曲初始影响。谣言与传染病具有相同的动力学机制，
但也有些不同。(1)时间过程不一致。谣言开始传播总是滞后或先于实际冲击的
传播； (2)它与接触传染相比，具有结构上的优势。实际冲击传播主要通过接触
过程才能完成，而谣言传播是信息的传播过程，因而它传播得更快速(路径短)；
(3)谣言可以同时实行点对点传播与跨网传播，因而它的联通度高于实际传播结
构网络，这一切都导致谣言比实际传播过程更容易形成高峰。(4)谣言与“传染
病”相比，其放大机制不同。当谣言在节点间快速传播的同时，它会改变节点的决
策模式，即从“收益占优”导入“风险占优”，因而出现了自我预期互强化现象。
这在金融恐慌时表现最为明显，而在股市的暴涨暴跌中也经常看到；但传染病等接
触传染是一个自然的传播过程； (5)谣言传播的成本、时滞和路径都较实际传播
有所不同。因此，谣言往往成为实际冲击的前奏，成为第一个高峰。接下来才是实
际冲击的高峰出现，见表(9．1)
表9-1小世界网络特征
节点特征联螬边传播特征形成豢件
传染病C1)节点：甚染人(1)身体或生理接(1)相对疆慢的(1)局部罔络不会形成太范围传
群及易感人群触、C2)空气传播；自然扩晨过程．播，转为地方流行病．(2)在随机
(2)稠密节点：家(3)人口流动：既表(2)可能或不会舟络中，局稚不密集，表现为随机
庭、学校、旅游区、现在公路、航空等，又形成高峰传染．(3)小世界同络会利用局部
社区等紧密接触群通过流动导致区域联密集和随机联系产生大范围传播．
体．结．
谣言(社(I)节点：社会群(1)社会联系直接传快速扩散，形成(I)局部和随机网络不会引起恐
会传染体播第一次高峰慌．C3)小世界同络引起恐慌．
病) (2)●密节点：医(2)通讯(电话、邮
院、权戚人士、杜会件等)
群体(朋友、血缘
等)、赚体
关联传染药品厂商、医院、防经济、技术联系操纵性智能扩散(1)小世界网络存在
(经济、护措施相关厂商．过程，第二次高(2)智能性周中人
政府) 蛙
9．4现实世界更接近“小世界网络”
“传染病”是否能够导致“社会传染病”，必须具有相应的社会经济结构特征。
现代经济几大重大特征，如城市化、产业高度关联、发达的交通网络、人口流动、
通讯媒体等，恰好具备了局部密集性、最短特征距离和随机联系的小世界网络特
征，因而我们说，现代社会网络是小世界网络，它是“传染病”和“社会传染病”
得以形成的结构基础。
当然，小世界网络不是传染病流行的唯一原因。制度的或策略行为也能合成这种
效果。例如，中国历史上著名的《叫魂》案例【191m就是官僚机构责任规则分配不当造
6孔E力苫‘叫魂；1768年中国妖术大恐慌，(上海三联出版社．1999。I)记康了发生在乾睦年问的一敬社会大恐慌·由于官僚结
构对信息的有组织歪曲．结果使一个无中生有的谣言波及大半个中田．
成的社会大恐慌(孔飞力，1897)，其中，乾隆皇帝对民情误读直接推动了这一事
件的发展。而历次农民起义也都有重大的谣言、传播组织活动作为事件的前奏(剪伯
赞，1959)口啪。这些案例都说明，与自然网络相比，经济网络中必须考虑节点智能
操纵的可能性，这是经济系统与自然系统显著区别‘931。
9．4．1自然特征：人口密集、人口流动、产业关联
改革开放后，两个重大事实促成了中国经济逐步演变为小世界网络结构。一是
人口的密集和随机流动的增加，最典型的是产业的区域高度聚集和城市化过程。这
一过程使人们的社会联系(节点密集系数)大大增加：人口流动又加剧了网络之间
的随机联系，这些流动人群、企业成为枢纽(hubs)，可以轻易地把随机冲击从一个网
络带入另一网络；另一方面，城市、产业群又是高度聚集的。这使产业、人群之间
具有最短的路径、局部高度密集、随机外部联系和指数式的节点连接度分布等重要
特征；第三，信息、运输交换系统通过一些中心节点(互联网、物流中心)建立城市
之间的联系或个人之间联系，又通过密集的关联配送到各个节点，缩短了节点距
离。特别是电话、互联网中的短信、手机等，它可以使任何两个人之间的信息距离
缩短为1。而在互联网这个“虚拟的世界”中，它就成为谣言爆炸性成长的关键
人。
9．4．2节点策略行为
与自然、物理网络不同的是，社会网络的节点都是具有理性的经济人。当他们
认识到网络结构和传播动力学特征后，他们会操纵这一过程，从而出现网络策略行
为。～些具有高度联接性的“枢纽”节点对网络的结构特征具有较多的知识，因此
他们具有智能性。按照Myerson(1992)和Shaple“1953)合作博弈理论，在～个确定
性网络中，个人的势力与它在网络中的地位有关，而这种地位可以通过势力指标算
出。～个长期互动的环境下，～个大型企业、个人是能够了解在网络中的地位的(势
力)。这一势力指标为：
t ，
P=三罗二。其中，s是两个节点之间的总节点数，在联盟博弈中，它等价p一品s
于一个联盟。U是所有连通路径的集合。
。往中田历次大的政治变革中，谣言总是它的前奏．陈胜、昊广的“娟火孤鸣”、得鱼腹中书“犬兴楚，陈胜王”·三国演义中
璜龙景观，有风来仪”，袁和尚起义之先的”石人一只眼，挑动黄河天下反”等都反映了“节点策略”性影响社会行为事实·这
也是为什么谣占很容易{l起上层误读的原因之一．
堡中科技大学博士学位．论文。222222。2222。222=====—；==品====≥==；：三
事实上，任何一次重大的经济波动、“社会流行病”都与某些关键人相关。由
于关键人知道它在网络中的地位，因此它对自己行为的网络外部性具有完全信息。
当它操纵这一过程时，它的收益会快速增长，尤其是在短期。而金融、产业、信息
操纵过程中的谣言都具有短期特征，因此总是有人推波助澜，乱中谋利。
9．5谣言的预警功能与智能干预：以非典型性肺炎为例
社会学家发现，二战时谣言特别盛行；而灾害预防学发现，地震等自然灾害往
往伴生严重的次生灾害(恐慌)：金融股票市场也经常出现群羊现象。但从总体上
来说，出现社会群体行为条件比较特殊，因此它不是经常的。出现群体行为基本条
件起码与下列几点相关： (1)初始冲击必须与个人利益高度相关，才能把许多人
注意力集中在这一事件上； (2)高度的不确定性使个体迅速转向“风险占优”决
策，导致暂时理性的丧失； (3)传统“免疫”控制机制失灵，新免疫机制尚未形
成。但是，一旦出现了群体行为，尤其是在小世界网络中，干预便不可避免，且不
是简单的。
9．5．1干预者的有限理性及无效性
我们可以把“小世界网络”看作是市场协调失灵的一种结构原因和群体基础的
话，那么对网络的结构干预便是政府干预的一个重要理由。我们政府确实具有一个
并行的干预网络存在。但是，正如经济学所说，政府可能因各种原因而出现反应滞
后、反应过度和反应不当问题。政府决策的基础恰好是传统预防模式的代表：通过
监测某一信号(预警系统)，超过“临介值”时才启动干预系统。这在一个随机均
匀网络中可能是合适的，但是在小世界网络中的传染病、经济冲击的传染，一旦我
们监测到临介值时，可能大势已去，严重后果业已铸就。其后，政府往往会采取过
度的反应方式，通过强烈刺激或引入严格的管制，对经济、社会造成“一刀切”式
的政策伤害。显然，这是非理性的干预，它会造成严重的双重损害。
小世界网络要求政府具有一个与它相适应的干预网络结构。即，政府需要对网
络节点结构和联结结构有比较完全的信息；迅速调整管理组织结构，有选择性地重
点干预，而不是随机均匀干预。
华中科技大学博士学位．论文
9．5-2谣言的预警功能及“社会免疫”能力的形成
由于不存在“临介值”问题，因此对依托于这一信号的决策都可能失效。但是
从上面的分析可以发现，小世界网络的两个重要特征为我们提供了重要线索，即节
点策略预防和连接边策略预防的可能性。
1)节点预防是建立在群体行为学的微观基础之上的，即个人面对重大风险
时，个人决策的变化：如果节点在面临传染病时，主动减少近邻的连接状况，就能
有效阻止节点和传染率。但是节点的信息传播却与此相反。
2)联结边预防。它包括减少接触传染机会，减少交通、通讯的随机传播等。
3)智能干预。即只关注最重要的关键联系、最重要的节点，避免不加选择的
干预。
但是，以上所说的干预都需要一个条件，就是政府对何时进行干预、谁是关键
的节点和联边有所认识。在缺乏“临介值”时，政府和个人可能还处于睡眠状态。
此时确实需要某种方式唤醒它。幸好，有这种机制，它就是谣言。谣言会先于实际
冲击，形成第一高峰。此时，基于个体的反应就会出现。某些人会尽量减少接触机
会并采取相应的预防措施等，政府、权威部门也会因此介入，普及相关知识，从而
提高了“社会免疫水平”。
2003年初出现在广东的非典型脯炎是谣言预警的成功案例，而艾滋病因未出现
这种强烈的群体反应方式，则是预防学上的一次失败案例。下面我们就用这一案例
来分析这一过程。广东非典型性肺炎经历了以下几个典型的步骤：
1)“隐蔽”传染与局部病例报告
自从2002年11月16日到3月底，非典型性肺炎的报告病例已达1323例，49
人死亡。目前已经在27个国家和地区发现案例。从传播动力学过程看，它是通过
小世界网络传染的。
(1)目前证明它是一种“接触性”传染病，因此节点联结状况决定了局部网
络的传播效率。凡是与病人接触机会多的场所如医院、社区、学校和家庭，都具有
“密集性”节点传染特征，极易感染；
(2)随机联系过程保持网络之间传播。这些传播主要通过旅行、交通、输入
性感染等途径保持了大范围的随机传播。例如，从发源地向北京传染过程中，它不
是逐渐由南向北过度的，而是通过随机联系跳过了中间区域，突然在遥远的地方冒
出来。又通过北京这一更密集的节点和随机联系过程，到处点火。
09
(3)在疾病传播的早期，由于病例都分散在局部网络中保持小规模“隐蔽”
传染，因而社会预警系统和干预系统未能识别出来。政府既未将之列入法定报告的
传染病，也未启动相应的预防措施。
2)谣言兴起
二月初，当感染还未激活政府预防机制时，谣言却利用它的高效传播机制开始
传播，最终形成了局部地区的社会恐慌。最先出现谣言的地区是该病首发地区广东
省河源市。当最初两例病例导致医务人员出现传染后，谣言开始按自己规律运行。
谣言传播所依赖的网络结构特征是：
(1)信息通过电话、手机、邮件方式实行端对端瞬时沟通，保持了很好的边
连通度；互联网、报纸等媒体利用其中心节点扩散信息；政府通过新闻途径不经意
地进行了信息公告和社会安抚【2I】回。
(3)由于沟通极其便利和成本低，导致传播路径大大缩短；一些接触到外地
信息的节点又利用“小圈子”传播。
(4)信息传播链条的延长，信息不断的歪曲、放大，个体决策的不确定性迅
速增加，为群体陷入非理性莫定了基础。
(5)由于信息通过紧密关系的节点来传播的，其可信性很高。
(6)在面临巨大风险情况下，群体处于“风险占优”的社会不合作状态【22】@。
显然，它依然是一个小世界网络。不过它更敏感，传播效率也更高。
3)节点策略行为与信息操纵
群体导入风险占优决策后将导致暂时群体理性的丧失，一些熟悉网络结构的节
点开始推波助澜，以此谋利。这些节点包括信息中心、疾病预防机构、医院、药商
等。一些厂商利用风险占优决策导致的非理性消费行为及与自己利益相关性，散布
信息，操纵消费过程。事后，一些药厂、互联网短信等因此而备受谴责，从利益相
关性分析，医院也应该有动力夸大风险【”】@。
4)政府干预滞后与社会预防机制的形成
。事实E，这里有至少三个并行网络：社会沟通网络、媒体信息同络和政府网络．这三个网络互相重迭t但各自又表现出自
己的独立行为．
。信息的可信性非常重要．在局部传染过程中，人们能够通过病例强化传染病这一信念；但是，远程通讯则面临可信性问
题．恰好，人们通过亲友关系传播和政府权戚都会提高信息可信性·
，厂商操纵现蒙在这次事件中暴露量为充分，部分口罩、白醋、扳蓝根生产商与经锖商事后受到哆贵、冀告或处分·但墨曼，
是乔参与诗谣、与厂商台藻未见报道，而桑机推锖药品、处方的广告却大厦出现在互联列上·例如，每搜寻一个“SARS”新
闻时，都宵相应的广告厂商与之联结．
IIO
(1)由于感染人数还未达到政府“临介水平”[241①，政府反应明显存在滞后和
反应不足问题；但是，在群体行为选择和节点操纵下，谣言迅速从广东传播至口全国
各地，从而出现了局部社会恐慌125】圆，各地夸大病情，抢购物资。
(2)在谣言的恐吓下，惊魂未定的公民迅速转入风险占优行为，群体行为学基
础已经发生了变化。但是，以个体为基础的防御机制也逐渐形成了。这些措施包括
减少接触机会、药物预防等。客观上说，它有力地减少了疫情的扩大。
在这里，谣言的重在功能就在于它唤醒了“节点”的预防意识。虽然它也造成
了暂时的社会恐慌，但却弥补“不知情传染”带来的重大疫情暴发后果。由于预防
的重点在于个体预防。所以我们说，一次重大谣言的冲击可能是一次远较政府宣传
有效得多的“预防医学普及”措施。而像艾滋病等重大传染病之所以能够在世界范
围内“悄悄传播”，恰恰是缺乏这样一次冲击的后果。因为许多传染者并未通过这
一过程“学习”到许多重大信息：病情的严重性和必要的预防措施。
5)政府智能干预
在谣言的强烈“提醒”下，政府已经面临强大的正面压力，被迫仓促干预。这
恰好弥补了在小世晁网络中政府可能提前观察不致疫情，等观察至4时又已经失控的
缺陷。此时，谣言已完成使命，逐渐退出舞台。让位于政府的正式干预机制。政府
被迫干预后1261@，采取的措施是：
(1)打击节点的策略性操纵。2月12日广州市物价、工商、公安等出面干预，
打击或警告一些不法厂商利用谣言和恐慌牟利行为，以企排除策略操纵导致的市场
“噪音”，商业抢购等非理性行为得到控制；
(2)恢复群体理性：政府通过信息公告澄清了事实真相，使公民对非典型性肺
炎的传播动态有了基本认识。事实开始向真相回归，谣言中的噪音进一步被过滤。
群体行为开始逐渐回归理性。
(3)理性干预：从2月初开始到4月初，政府干预措旌逐渐出现了理性。在早
期干预时，由于对该病的定性、预防等并不是非常清楚，政府干预具有盲目性。首
先，世界卫生组织、医疗科研机构及临床学网络开始正视这一疾病的严重性；其
次，政府主动与全球合作，并通过权威机构正式发布动态信息，进一步对节点进行
安抚，消除谣言的网络节点基础：第三，对传播途径进行严格的“漂洗”，包括打
。在2月12日的记者招待会上．广东省卫生厅官员说，“由于瘦情还不到政府公告的水平t因而政府未进行提前公告”·所谓
的“水平”叩指。临介值”．直到4月中旬，嗣家才把非典列入法定报告传染病之列．
4在“传染稿”保持自己的接触传染过程中，许多地方当时并未出现病例．但是，谣言引起韵恐慌性抢购导致2月初在武汉、
广西甚至许多偏僻地区出现了．这充分说明了谣言比实际传染范围更大、更快更有效·
。事后，有攥体谴责政府的不当反应加剧了谣言的传播和社会恐慌过程．政府反应不当存在几个方面，一是反应滞后，二是
不当．前肴是可以理解的．因为政府缺乏信息．但是，政府过份管制、缺乏干预智能性确实暴露了在通讯茇达时代的反应不
当问韪．
击非法操纵、澄清真相、动态公布疫情等；第四，提出了相应的预防措施，对节点
与随机联系的边进行了相应的管理。对于一稠密的节点，如学校、医院、交通工具
等地方进行消毒，对发生随机联系的路径进行严格管理等。
但是，我们不能否认，谣言早在政府干预之前已经代替政府完成了部分功
能，尽管它的响应存在过度和不恰当之处。谣言的预警功能是一举两得的：一是它
及时地提醒了政府问题的严重性，避免贻误疫情的后果；二是以最强烈的方式，唤
醒公民的预防意识。这不仅建立预防医学的微观群体基础一自我保护导致的群防群
治，也提高了政府干预的效率和减少不必要的损失。当政府正式启动预防机制时，
它也逐渐让位于政府的正式干预。谣言减少了重大损失，也替代了政府部分功能。
相反，艾滋病的传染过程则由于省略了这一过程，结果导致完全不同的后果。尽管
政府目前已经建立了比较正规的防范措施，但是公民则是通过被动学习过程来获得
这一信息的。
9．6结论及意义
从上面的分析可以初步得出以下结论：
1)经济、社会的总体表现取决于两个方面，一是各个参与人的自我策略选
择，二是参与人之间的网络联结结构。当参与人处于“收益占优”主导类型时，将
导致社会合作与群体理性行为；当“风险占优”占主导时，就会出现群体不合作与
社会非理性问题。但是，个体策略的宏观效果及传播动力学特征取决于它所依赖的
网络结构，小世界网络能够特别快速地传播外部冲击。
2)我们所处的现实社会是一个小世界网络。所以经济的异常波动、传染病、
社会传染病等都会经常出现。但是，谣言所依赖的网络结点、路径特征可能与收
益、风险相结合，更容易传染。谣言的出现为我们识别某种冲击提供了一个重要线
索。
3)政府、社会正规干预网络的反应机制是建立在随机网络或局部网络基础之
上的，因此它可能反应滞后、反应不当。但是，谣言能够利用其优势迅速形成过度
反应，从而触发两个机制，一是导致所有节点决策行为的变化，从而减少或加速传
染过程；二是为启动正式机制的介入提供信息支持。
4)谣言的功能主要在于“预警”。一旦社会预防的正式机制被激活，它将逐
渐退出。政府的智能干预将“漂冼”大量“噪音”，使群体行为回复到理性状态。
政府对经济和社会的干预，不外乎两种目标：一是如何弓l导群体行为，使整个
经济出现网络外部性成长，从而使之产生协调、合作行为。二是当类似传染病、金
融危机等不利的群体行为出现时，如何理性地、经济地进行干预，瓦解这种合成机
制。所有的干预首先都是建立在对经济及社会结构的认识上的，无论是启动经济增
长，平抑波动促进稳定，还是传染病预防学。
小世界网络对经济干预理念的影响是多方面的。
首先，任何干预都依赖于对预警信号的观察，即统计学上的“临介值”识别：
其次，针对传递政策变量的不同网络结构施加影响。但是，小世界网络的超强抗随
机打击能力、高传播效率、无临介值等特征，可能使传统的政策失效。但是，小世
界网络的另外一些特征，如对智能打击的敏感性、信息高峰的快速出现等特征，恰
好又弥补了以上缺点的不足。从而为我们的经济干预提供了有利的线索。
(1)关键节点问题
具有高聚集性、具有广泛联系的节点对传递随机冲击、传递宏观经济政策具有
重要作用。这些节点就是城市、产业中心、关联度大的企业、影响广泛的人群等，
他们一般保持了较多的经济、社会联系。他们对于启动经济增长、主导经济波动和
传播社会冲击方面具有关键作用。通过对计算机病毒、传染病的研究证明，关键的
预防比全面预防成本低、效果好；在对艾滋病流行研究中发现，传播确实只从一小
部分人开始。因此，瞄准最关键的一小部分人最为重要。
(2)信息的识别问题
长期以来，我们排斥谣言等非正规信息来源作为决策基础。然而，我们的正规
信息渠道及预防机制又可能因各种原因不能启动。此时，谣言流行和社会的非理性
响应应该受到重视。在历史上，就有利用小道消息为政策服务的案例，例如“子产
不毁乡校”就是类似情况【27临。
(3)干预智能性
令人回味的是，当对这些冲击处理不当时，政府可能是强化而不是削弱这一传
播效果。例如，《叫魂》【94】是一个典型案例，由于责任分配不当引起的扭曲过程，
一个小谣言沿着官僚系统扩散，最后无中生有地制造了一次大恐慌。期间最高统治
者对民情误读起了关键作用。因为它过份强调了操纵者的挑战，结果逼着官僚们歪
曲这一信息来推卸责任。
非典型性肺炎事件也出现了一些值得注意的问题。在有些地区，恰好是通过权
威新闻后才感觉到问题严重性的。在信息接受者初次接触到信息时，由于无法确
证，此时pk<1。但是当政府出面证实后，由于政府的决策函数决定了只有重大情
。于产不毁乡校记载了释软时代郑翻相园子产对“街谈巷议”的看法，他认为在那里可能提前捕捉到社会的真实声音，从瓶
可以提前进行顶防和疏导．对于一个管理严格的社会来说，往往会因信息不畅出现“川雍而溃，伤人必多”的局面，但是只
要’与政|I}往意倾听“乡校”等非正规途径的信息。问题能够得到有效解决．因此，他不E张取消“多控”·
华中科技大学博士学位．论文
况才出面澄清，且民众可能认为政府为缓和大众情绪而不真实报告病情，结果，导
致P。快速修正到100％，并传递给近邻。
政府处理不当还会造成“围空”现象。即中心区出现免疫现象，外围谣言却
继续传播。由于中心区信息的充分披露、得力的措旖和集中管理，病症传染和社会
传染都将会很快得到有效控制。但在外围地区，则由于不充足的信息、轻视和感染
人数相对少，潜在传播的可能性较大。例如，艾滋病在最早集中出现的地区就控制
得较好，但在其它地区则严重得多。
政府干预也面临着困境。传统社会由于流动不频繁，结果社会、经济分割为
“一簇簇”的群落，它是典型的局部网络。这种分割导致传染中断现象早被传染病
预防医学所采用。然而，“传染病”所借助的结构正是我们经济得以增长的高效结
构，如城市化、通讯交通发达、分工互补网络及自由流动性。如果我们仅仅从控制
经济危机、社会恐慌和传染病而过份伤害了这个网络的连通性、密集性和高效性，
经济也会深深受到伤害。在广东事件出现后，许多媒体就出现了加强对短信管制的
呼声。但我们姑且不论管制的成本和绩效问题，起码应该看到谣言的预警功能。政
府应该学会如何利用谣言的有利功能同时防止其破坏性。
10．1问题的提出
10群体协调及协调人策略不稳定
一个相互作用的大群体之间的策略互动模式往往会出现很多种均衡解，其中有
些具有很好福利性质的均衡，由于个人理性选择而不能实现。尤其严重的是，纳什
均衡解有时会导致合作组织中参与人集是空的，对应着一个网络时，这个网络是零
阶网络128】o。或者用公式表示：
1)对于联盟来说：v(矿)=0
2)或者对于网络来说：WG)=0
这种博弈均衡解意味着每个参与人的所得支付都只为保留支付。为了模型化方
便，我们一般令其为零支付。对于一个满足可加性(addictives)的合作博弈来说，
设参与人数为N，各个联盟都是N的子集，其收益都不能达到最大的收益，因此
“囚徒困境”可以表现在不同的层次上。这对一些具有满足可加性的合作结构最为
明显。
给定一个具有更好福利水平的纳什均衡解的博弈结构，只要这个均衡具有稳定
性并且是可预期的，参与人会尝试通过各种途径去探索更好的策略，或者设法去这
个博弈，以便获得更好的支付129】o。现在博弈论理论认为，能够导向合作的几种主
要合作途径有：(1)通过局中人之间的相互通讯来协调(Myerson，1991t”1；Aumann，
19741蚓)；(2)通过签订具有约束力的合同过程来实现双方或多方的行为协调(Myerson，
1991)；(3)通过类似企业一样的组织把参与人内部化，这事实上是建立一个更大的联
盟过程或经济的网络化过程【30】o；(4)通过斯坦克尔伯格过程引导群体的学习过程
(Fudenberg，1992，1989)1971：(5)通过长期博弈过程中的监督和惩罚来实现[9sI，然而这
种博弈一是会出现“连锁店悖论”问题，二是当出现了类似“传染局模型”情况
时，即便把惩罚调整到无穷大也不能保证合作的出现，这对时间贴现率非常高、流
动性比较大或群体高度异质环境下的博弈局势来说，就显得格外另人担心
。网络中的节点数耳称为网络的阶数．由于一个n人博弈可以用相应的网络表示，其节点代表参与人集，所以
当出现纳什。囚徒困境”时，合作博弈转化为一个非合作博奔，网络是各个独立的参与人·即，阶数为0·
’当然，在某些条件下改造博弈的成本过于昂贵时，长期的4囚徒困境”会出现．例如印度种姓制就曾经出现
了长时期的背叛振荡过程(Aexlod，1973)．
’闷络化过程不一定要求严格的有形组织形式．某种合同网络或委托一代理网络、市场交易网络及目前所说的
。虚拟组织”都能完成这一过程，不过它要求更商的坍调类型出现-
5
华中科技大学博士学位．论文
(Kandori，1988)1991：(6)引入中介(策略型局中人)来实lg(Myerson，1992)；(7)通过引入
背景协调(非策略型局中人)来实现；(8)进化均衡(Aexlord，1974)。(9)改变信息结构
等。
参与人为了改造博弈的结构会通过通讯、协调和调整互动时间，从而保证使行
为集中在“焦点效应”对应的策略上。显示原理也断言，群体最优行为重要条件
是，它必须满足Harsanyi和Selten(1988)【I oo】的帕累托优性条件。如果是风险占优
(Risk—dominant)，则可能会出现群体的次优选择，结果使群体陷入非合作状态。
Cobble(1992)等模拟了一系列协调博弈类型，得到的基本结论是，在所有的
协调博弈中，最终都需要一个中心机制，它负责来给每个参与人推荐策略。只要每
个参与人按照它的策略行动，结果将会是最优的，并且任何人都不会有动力偏离
它。这些策略博弈都有～个共同特征：(1)中心机制是一个非策略型的局中人；(2)
它在一个小群体中是稳定的，例如2人环境，最多是一个社区等。然而对于一个自
然实验，一个国家或者世界对策、区域互动过程，这种博弈环境将显得特别成问
题。因为实施的惩罚环境可能出现传染局模型的结果；进化的学习过程也会特别长
【31】o而超出了个体受益时间；有些种群(策略)的进化步伐根本跟不上变异步伐就
已经灭绝。因此，个体的决策时间不可能等同于任意设定的博弈类型中的时间。
10．2焦点效应
在一个多人博弈结构中，往往会出现多重均衡，从而使我们对行为预测产生困
难。然而，给定一个对策，确实会存在许多种原因导致局中人之间的相互预期协
调，从而执行某一特定的均筏策略。在多重均衡集中．趋向于把局中人的注意力集
中到一个均衡的任何事情都可能使它们全部预期到并执行该均衡，就像一个自行验
证的预言一样。这种现象曾经被谢林(schening，1960)i10。1详尽研究过，它称之为焦点
效应“bcal．point effect)。如果一个博弈局势存在一种显著区别于其它均衡的均衡策
略，那么我们将预期能够观察到这一均衡，这一均衡就是焦点均衡(focal
equilibrium)．
决定焦点均衡的因素非常多。在一个具有多种可能均衡解的博弈环境下，任何
一种引导参与人共同实施某一策略的因素都嚼于焦点的决定因素。从这个意义上
看，市场、国家、参与人本身、文化传统等都将会影响局中人的策略选择，从而有
可能使博弈中的任何均衡解都有可能得到实行。下面主要论述几种大的协调因素。
鲨塑攀
1)文化传统文化传统通过人际互动过程，影响人们日常的行为选择。例
如，在不同的文化传统中，性别战就会有完全不同的解决方案(Myerson,1992)。文
化传统在协调人们之间行为向焦点效应集中具有非常广泛的意义，从而使一个具有
类似群体之间相互作用时，行为具有可预测性。例如在中国传统的人际冲突中，
“三纲五常口2】”’总是赋予某些参与人的被动执行策略。即使在今天的日常家庭决
策中，我们仍然可以看到一些简单的处理方法，从而使“清官难断家务事”。
文化规范(cultural norms)可以定义为一个社会用于确定博弈局势焦点均衡的规
则。一系列博弈实验验证了文化的强烈聚焦性质，这些实验可以在Roth and
Schoumakeffl993)，Cooper，DcJong，Forsythe和Ross(199，1990)以及Van Huyck，
Battalio and Beil(1990)ll 02】等的著作中找到详细内容，它目前已经成为社会心理学
和文化人类学的一个重要研究课题。
2)焦点仲裁人当存在局前通讯可能时，如果某人能通过向局中人公开地建
议，说大家都应该实施某个均衡策略，那么这个均衡策略就会成为焦点均衡。提出
建议的人被称为“焦点仲裁人”(focal arbitrat00。在一个均衡集非常大的博弈中，
焦点仲裁人可以充当一个仲裁者(或者社会计划者)，来对对策人实施实质性影
响，因为按照他的建议去做，所有人的支付都将得到改善。除了上面所说的文化传
统外，还有一些重要的“虚拟仲裁人”。例如，一个组织中的上级、一个国家或地
方政府、市场中交换的货币、一个区域市场或商场等。一个最为宏观的协调人应该
是自然环境一气候变量，它在生态系统、社会经济系统中的协调作用最为引人注
目。
3)制度均衡制度规则会直接规定个人的行为选择，因此决定了相应的焦点
均衡。由于制度的无所不在，制度性焦点均衡也无所不在。考虑一个公司内部的策
略博弈情况。公司内部制度赋予了最高决策者的策略选择权，假设它是一个(O，1)决
策。下面有很多决策支持部门，负责将向它提供多种理性决策支持方案，但其中只
有一个是被执行的，下面我们看可能的执行后果：
设A={1，l，1，l，l，1)是一个决策者个人信息集，它代表了决策者的个人偏好。它在
组织中被赋予决策地位，负责O．1决策，选择他认为好的下级方案。它下面的四个
决策支持方案分别由具有不同背景的参与人提出，每个决策都有一个最大支付
v(6．)。如果部门经理提出了以下几种方案，其策略和支付为
(B1，50)，(B2，100)，(B3，70)，034，20)，即：
o一·三纲-，足指“君为臣纲，父为子纲．夫为妻纲”，五常是指“仁、义、礼、智、信”。但当父子、夫妻关
系与国家、尊权利益发生目标冲突时，宗法体系也考虑了相应的方案，如‘清律》就规定，除了“十恶不赦”
B1={1，0，0，1，l，0)，v(b1)=50
B2={0，l，Ol，l，O)，v(b2)=1 00
B3={1，0，l，1，0，1)，v(b3)；70
B4={1,1，1，1，1，1)，vCb4)=20
那么，我们预期最高决策者最终会选择那一个策略昵?显然，如果决策受到自
己的背景偏好影响，那么决策者事实上是在不同方案中选择与自己偏好相关的方
案。因此只有与之特征相似(或一致)的策略才会被他接受。考虑各个决策信息集合
与A集合的交集：
(爿n马)={l，l，1)，AnB2={l，1，1)，AnBj={l，l，1，1)，An日={1,1，1，1，1，1)
我们说决策者选择与之最一致的方案，就是指交集中元素最多的策略：
maxv(AnB。)=vCb4)=20，f；1,2,3,4
其中，A内的“l”代表经理所偏好的个人特征，这些特征可能说明他隶属于
某一群体(亲戚、战友、伙伴等)，或是否具有某一生存经历等。“0”代表不具有这
种经历或不属于这一群体。交集反映了两种方案的相似性，它是一个复杂的社会距
离【33】①。当交集最小时，反映两者之间差别最大，相应地是距离系数最大，因此该
方案不可能被经理选中。结果，从上面的选择方案看，按偏好相近选择的方案所得
支付是最差的，仅仅获得20单位的支付。这反映了在一个国家、企业中存在的普
遍现实：为什么下级总是尽量提供与上级偏好一致的方案，而不良业绩的出现甚至
企业破产、决策失误等现象，我们不能简单地说是内部没有产生出最优对策，而是
制度性焦点效应导致的选择性误差造成的。制度性聚焦过程可能会产生下面几种制
度性后果，一是优秀决策不被采用，因为决策者不是把支付作为唯一的策略选择依
据：二是出现的所谓“逆向选择”问题。即能提供优秀策略的人因长期不受重视而
离开了。而保留下来的是一些只提供与经理距离最小的方案而不是最优的市场对
策。三是一个仅靠偏好决策的策略选择者有时并不如一个“无为而治”的上级，因
为混合策略收益为80单位，远较第四方案收益高。
在现实中，一个制度往往从多个方面定义了一个群体的游戏规则。我们的一个
法律体系集合往往非常全面的规定了个人的角色、权利、义务以及罚则【34归，并且
的罪行外，其它的案例必须首先受宗法约柬．例如，儿子不可以轻易告老子·
o抽象的距离可以从“分类学”文献中详细了解到，并且有专门的度量距离的各种方法．而社会距离是一般距
离在社会学中的运用，它用来衡量个体或群体的相似性．尽管大量信息下的计算存在困难，然而目前的常规软
件如sPss、sAs等都能进行处理．
。‘宪法》规定了制度的基本框架，它相当于在n人嗣络中规定那些生成树是合法的。权力通过树的结构来分
配；而民法和商法则规定了公民的摹本交往、交易规则．其它的专业法律也规定了相应角色之问的组网规则问
题．对于公民之间的冲突问题，每种法律都规定了一些解决问题的条款．从而使网络得以维持·
118
华中科技大学博士学位．论文
通过一个相应的司法体系柬保证群体行为聚焦在制度容忍的限度内。这就是为什么
如此多样化的世界能够保持相对合作、协调的一个重要原因。
10．3焦点效应的探索过程
在很多囚徒困境中，确实会出现一些稳定的均衡集，这些均衡集具有这样性
质：一是相对于其它均衡来说，它的福利效果非常差，因而出现了社会非理性问
题；二是从个人角度来说，它虽是非“帕累托最优”的，但却是“风险占优”的，
因此仍然是符合个理性的：三是在给定的博弈结构及条件下，如果不再附加其它条
件限制，该策略是稳健的(robust)。
但是，只要有更好的福利性质的均衡集存在，焦点效应会引导参与人去探索
它。目前博弈论理论已经从很多方面对这类均衡的协调聚焦过程进行过探索。下面
我们择要地进行论述：
1)长期关系或重复博弈中的进化均衡
长期关系与重复博弈具有内在相似性，即参与人都从长期收益上考虑策略选
择。假设把长期博弈细分为许多个回合，那么参与人的长期收益是各个回合的收益
和。每个回合的策略都将影响到对方的策略响应模式，从而也会影响至Ⅱ他的总体收
益。由于每一回合都是建立在“囚徒困境”博弈框架下的，因此这种非合作方法内
含一个激励与惩罚的机制：如果双方按合作策略行动，最终都将得到最好的支付，
因而它诱导双方合作；一旦双方偏离了最优的合作轨道，都只能得到非合作解，因
而它构成了一种持续的惩罚成胁。
所以，在一个具有长期互动机会的环境中，博弈双方就有可能走向合作。正如
KMRW定理所说的，“在T阶段重复囚徒困境博弈中，如果每个囚徒有P>_0的概
率是非理性的(即只选择冷酷战略或针锋相对战略)，如果T足够大，那么存在一个
瓦-4 T，使得下列战略构成一个精炼贝叶斯均衡：所有理性囚徒在f<％阶段选择
合作，在r卜瓦阶段选择不合作，并且合作阶段的数量只与P相关而与T不相
关”。从这里可以看出，合作严格依赖于双方战略。
不过长期合作还依赖于以下变量：双方时间贴现率、策略行为、初始信念、行
动的可观测性、结果的可观测性、群体的规模及同质性和时问长短等闲素。Tirole
(1986)【103J证明了在一个垄断的合作结构中，观察的滞后导致惩罚的不及时、需
求波动导致的不可诅-实、惩罚强度受到某些条件限制，从而使一个合作组织具有内
在的不稳定性：Kandori(1086)的传染局(contagious scenarios)模型则说明t一旦群体
中有一小部分人偏离了合作轨道，将会导致不合作策略的暴发式成长t最后使整个
群体陷入囚徒困境。因此，在小群体中能够得以维持的合作行为并不适用于大群
体。因为一旦出现了背叛策略“传染病”，即使极端的惩罚方案都不足以阻止群体
合作的瓦解。
时间的集焦作用在现实中能找到广泛的例子：大商场与跳蚤市场相比，前者
可能更诚实、讲信誉；具有共同生活经历的群体或小群体内的行为更具合作性；而
“59岁”现象、人口流动性大的地区犯罪率相对比较高一些等都说明了这一类似问
题。Aexlord(1974)等通过实验证实，长期互动及“针锋相对”策略具有进化上的稳
键性，并且在非常极端的环境下，害怕下次遭受惩罚也能制止背叛行为。例如，在
二战中的前沿阵地，长期驻守阵地的敌对双方为避免日常的痛苦消耗战，也自动出
现了协调行为。但是，它的条件是，双方严格限制在具有长期接触这一假设之下。
2)合同与通讯过程
局中人为了扩大均衡集以便包括更好的结果，往往会通过参与人之间的相互通
讯过程来协调他们的行动，甚至通过订立合同式协议来改造博弈结构。对于一个具
有合同的博弈来说，如果个人理性条件(8．1)得到严格满足：
∽(∥)≥V，，i∈N (8-1)
其中，个人最低支付由(8．2)中的安全水平或保留支付(最小化最大值)决定：
vj 2。．罂豫。(鼍磐)乏；7一(c一)虬(CN-i，Ci)) (8。2)
‘Ⅳ一Jto～一●
那么，迈(Myerson，1992)证明，如果条件(8．1)中的不等式能得到满足的话，签
约博弈是完美的、适度的和持久的。不过，在支付集内，每个人都有广泛的讨价还
价自由。其讨价还价函数为：
≯(F，v)e argmax l l(‘一v．) (8—3)
JF，n，’二矿
在很多博弈中，由于结果及行动的不可观察、不可证实性(如产业数量竞争中的
卡特尔联盟)，对违约的惩罚不够充分或不及时、策略中存在下限支付限制(如最低
工资、人权标准、环境标准等)，或者缺乏一个中心执行机制，都可能导致局中入不
会保证遵守合同。尤其值得注意的是，当合同的收益分布在一个很长的时期时，由
于收益分布不均匀导致的行为不一致问题特别引人关注。例如，当合同终止时或参
与人时间贴现率迅速上升为l时，从上面的长期博弈中可以看到，参与人的策略选
择将使合作的可靠性变得非常值得怀疑。
不过，局中人之间除了博弈结构中规定的显性策略选择之外，还有相互睁陛选
择自由时，相互通讯和协调是可能的。策略型博弈的显示原理证明，对任何一个策
20
略型博弈通过增加一个局前通讯系统而生成的博弈来说，其任何一个均衡都等价于
一个满足策略激励约束的相关均衡，该策略激励约束为f8．41：
U≥Σ∥(c)H(c。五(c，))，i∈N，4：c．叶cl (8—4)
cEC
条件(8-4)等价于不等式方程组(8．5)：
乞∥(c)(“。(c)一"；(c。，P。))≥o，i∈N，C．∈C。，e．∈C。(8—5)
tIE■J
这就是说，一个调解人推荐一个既满足参与约束(8．1)又满足激励约束(8—4)ff÷J方
案，双方将都会愿意按规则出牌，任何一个人都没有动力偏离最优的轨道。
10．4协调人策略不稳定性与合同解体
以上的博弈都做出了一个重要假定：(1)协调人策略始终是稳定的；(2)协调人
策略是可以预期的。在以上两种假定下，参与人都能够能动通过长期的学习过程、
自然或社会选择过程来寻找到自己的协调变量(协调人)，从而精炼均衡，把所有人
行为都协调到最大均衡支付的策略上来。在这一策略下，参与人之间不再需要相互
通讯过程、对私人信息(类型)的过多了解、也不再需要寻找类似Aexlord或Maynard
smith(1974)I105l式的稳键策略和讨价还价过程。他们所需要作的是：所有参与人
只单独地和协调人分别签订合同，然后按协调人推荐的策略出牌既可。例如，假设
货币是一个协调人，它可以充当所有商品的交换媒体；物候与大自然之间的稳定关
系；政府宏观经济政策对群体的引导；文化对群体内行为的诱导等都是一个类似过
程。然而，当协调人行为不确定不可预期时，问题就出现了。
协调人突然出现问题可能表现在以下几个方面。
1)协调背景的突然消失或者逐渐消失
前者的典型例子是，它代表着参与人对协调人的记忆的渐渐丧失。如民族传统
的消失或被其它物种所侵入；另外一种突然出现协调人消失的例子是像前苏联政府
休克疗法导致的整个国民经济供需网络突然崩溃而出现的持续十多年的经济衰退现
象那样，由于中心协调的消失而导致的大量子联盟的出现。
2)协调人由一个非策略型局中人突然转化为策略型局中人
例如一个政府由无为而治突然转入积极干预政策，生态环境由外生的转为内生
变量(当它与社会经济系统之间出现相互相互作用)而导致的不中立现象DTI<D；
3)协调背景由单一策略改变为混合策略或出现以前不曾经出现的策略
。在一般情况F．人们认为自然界是一个外生变量．印它是一个非策略型局中人．但是r当环境遭到严重破坏时t它的行为
可能丧现出与人类行为的相关性．倒如．三峡工程可能导致局部气候的变化，战争导致地震更加频繁等，这都会导致自然舰
雄的变化，使之变为一个策略型局中人．
12l
如果协调人策略是缓慢变化的且是可预期的，局中人就能够通过预期协调、学
习和适应过程来达到反应均衡；但是，当策略出现异常变化时，它可能超过了其它
策略参与人的进化步伐，从而会出现一系列的紊乱。
4)协调人突然出现不可识别的异常随机策略
这种策略的出现使得以此为信号的相关群体突然失去协调和背景预期，出现局
部或整体混乱状况。如区域突然出现异常的自然灾害、政府突然出现不可识别的策
略等，都属于这一类情况。
策略异常的出现会严重影响现有的社会合作体系。因为所有人都已经与协调人
签订了一个按预期规则行动的合同，在这种情况下任何一个人都将导致收益的增
加。但是当这个协调人出现了异常时，与之相关的所有群体都将失去共同的准则，
群体将陷入一个长期的合作探索过程。下面我们通过几个具体的实例来说明当协调
人异常时的群体选择过程。
10．5群体行为中协调人的作用：案例分析
协调博弈具有重要的潜在用途。在20世纪70年代开始，一些关注协调博弈的
模拟就已经成为最激动人心的学术领域之一。但那些理论大多把重点关注在博弈的
均衡行为预测方面，对博弈人的特征、寻找方式和协调人策略不稳定等问题，关注
的太少。加之，博弈论的分析过于抽象，使之丧失了对现实世界的生动解释能力。
本文试图开辟另一思路，即从个案入手，对文章涉及的理论进行解释。
在《异花授粉植物的策略选择一生态理性的形成》(案例1)中，作者分析了
自然界中的进化协调问题。其理论背景除了生物学常识性知识以外，其它的都是与
本文分析方法相关的问题。《价值与风险的“时间拥挤”现象》(案例2)论述了
这样一个问题，时间作为一个计量单位，本来应该具有相当自然的行为表现。但
是，当时间被不同的群体用作协调者时，它就变得非常的不均匀。这种不均匀主要
通过人们的消费、生产行为体现出来，从而使时间的价值与风险相当拥挤。在这
里，作者试图把协调博弈行为扩展到群体行为的经济方面，从而认清从个人到群体
的生产、消费和选择过程既能合成为一种宏观经济力量，也是传导随机外部冲击的
重要微观机制。分散群体行为合成中的协调机制本来应该具有异乎寻常的作用，然
而却长期被经济界所忽视。
文化作为协调人及其文化变异、消失对社会的冲击，可以从《文化协调作用的
消失》(案例3)中看出。它与《政府政策随机化》(案例4)、《自然策略随机
化与灾害预防学》(案例5)和《气候异常与商业策略》(案例6)等是基本接近
的问题。从以上案例可以发现，自然、政府、文化等都具有协调人特征，当它们出
现策略不稳定时，会对生态系统、社会经济系统产生破坏性后果。如果这种策略的
变异是可识别、可预期的，并且在被协调群体的进化步伐容许范围以内时，那么它
只会影响效率，不会导致群体的合作崩溃；但是，当这种变异是不可识别的、非意
料中的，并且超过了群体的进化适应能力时，它的后果将是灾难性的。
lO．6协调博弈的现实意义
1)协调博弈的主要结论及政策意义
协调博弈的重要意义是，对于n．人博弈来说，由于众多的联盟形态之间的相互
作用，可能导致群体行为出现“囚徒困境”问题。在诸多解决“囚徒困境”的方案
中，一般都附加了许多特殊的执行条件。考虑到时间及交易成本的存在，这些条件
往往并不完全具备。然而通过协调过程，就会避免各个参与人之间的直接通讯过沟
通，也不需要参与人之间进行无限次的重复博弈过程。只要参与人按照协调人推荐
的策略行动，双方将共享合作收益，否则各方福利水平都将下降。因此每个人都没
有动力去背叛该策略。
但是，当协调人策略不稳定时，参照协调背景的部分行为将会出现混乱，从而
出现经济网络或生态网络的“局部崩塌”现象，这是宏观经济的～种重要微观机
制。因此，我们可以认为，协调是微观行为合成为宏观效果的重要途径；同时，它
也是传递宏观经济冲击的一条重要渠道或结构原因。从上面的分析可以看出，
(1)对于大变量、大尺度的协调背景变化过程，如政府政策、自然环境、文化传
统等的协调问题，局中人都相当于以它为参数订立了一个合同。局中人只要保持与
协调人通讯而不必保持广泛的通讯过程就能达到交易的完成，从而简化了现实中的
交易关系。如果协调人策略随机化，系统都将趋于紊乱。这对气候的异常波动、政
府宏观政策的一致性、群体相似性都非常重要。(2)当协调人策略变化节奏缓慢
且是可预期的，那么局中人就能够通过贝叶斯学习过程来适应它，从而保持和协调
人的步调一致性。只要变化过程不超过其参与人的学习速度和限度，局中人都能够
通过学习过程来保持动态均衡： (3)一种协调尺度向另一种协调尺度的转换过程
是一次冒险的跳跃，它可能导致类似前苏联式的休克疗法的后果，该后果是整个供
应链协调的失灵，而重建一个协调系统并能正常运行则是10年以后的事了；它也
可以是中国式渐进自适应方式进化，因为有控制的制度转换，不存在协调人突然消
失而出现的经济、社会混乱问题。在生物学意义上，协调尺度转换可能是物种大灭
绝的重要原因。
(1)积极意义
从上厩案例可以看出，一个分散群体是可以通过种种途径整合到不同的合作层
次上的。即，通过简化参与人关系、减少参与人数量来整合。这就使一个庞大的群
体行为问题变得并不像非合作博弈所论述的那样严重。现实中的协调人如政府、文
化、环境等，可能存在这样或那样的问题，但它作为漫长的自然和社会选择的结
果，对于维护群体活动仍然普遍是有效的。协调人的积极意义在于避免了社会和自
然之间的昂贵沟通过程，从而以一种非常节约的方式协调着群体行为，并获得了群
体最大支付，也满足个人最大化条件。同时，通过协调整合后，一个大群体博弈的
参与人关系能够得到大大简化，这也导致了过多的沟通和讨价还价问题。
(2)消极意义
然而协调博弈也具有很大的破坏性。当一个合作接体中的协调人出现问题时，
整个“食物网”都将面临着崩溃的危险。由于协调人是通过长期探索筛选出来的，
它的产生过程可能非常昂贵。因此当我们破坏它时，后果就会非常严重。最极端的
例子是前苏联的“休克疗法”带来的痛苦后果。由于中央计划机构已经是整个国家
的协调人，国家的统一和社会供需网络的构建都是在它的统一计划之下的，因此它
是一个标准的协调人(社会计划者)。苏共的倒台几乎是在一宿之间。国家协调系
统的突然消失，导致了后来群体行为的异常混乱。(1)作为政治集团，出现了多
个竞争性政党。(2)作为国家的协调人，它的消失导致了前苏联国家联盟的崩
溃，最后稳定在传统的国界上。统一的协调人让位于传统的协调人； (2)在经济
上，统一的供应链崩溃了。随后是长达十数年的政治协调人的选择和经济网络重构
过程。期间伴随的经济衰退和民族问题等，至今仍然困扰着这一区域。中国的改革
则不同。作为一个协调人的中国共产党，它首先缓慢的改变政策策略并考虑了整个
社会的学习和适应速度，从而使整个国家经历了一次可预期的制度冲击过程。生活
在今天的中国公民已经经历了20多年几乎连续不断的制度变革过程，使得今天中
国与20多年前相比已经发生了彻底变化，但整个社会的协调系统从未出现重大混
乱。虽然在改革过程中出现了通货膨胀、区域不均衡、群体收益分配等结构性问
题，但整个国家网络的合作性始终得到了维护。
协调人如此重要，以致在最极端的环境下也得考虑其可能后果。下面是参考消
息下的一段话Il”1：
(记者)：据说美国在参考第二次世界大战后占领日本的方式制订占领伊拉克的计划，是这样吗?
塞缨尔亨延顿(哈佛大学教授)：这是无稽之谈．伊拉克根本不具备当时日本天皇制(协调人：作者注)下
绝对权威的基础．美国不管用谁取代萨达姆，都不可能拥有绝对的权威．并且在伊拉克有许多宗派和民族(联
盟尺度：协谓人)，在这点上与El本不同．阿富汗的新领导人为团结各民族领导人费心机，伊拉克政权将面临
比阿富}{：更犬的困难．
华中科技大学博士学位．论文
更重要的是，如果战争暴发，无疑会刺激“伊斯兰世界”(另一协调尺度)，从而国家冲突扩大为文明冲
突，半年后伊拉克国民就会要增求把美国赶出伊拉克(国家联盟竞争时，国家成为一个自然协调人)。反美
斗争会演变成权力斗争(争当协调人)，伊拉克会陷入无秩序状态(联盟囚徒困境)．伊拉克混乱将会影响到伊朗、
科威特、沙特阿拉伯，中东将陷入不稳定状态．
因此，(美国)应该耐心的利用较长时问建立一个稳健、负责任的政府．
这段话决不是危言耸听，回想前苏联便十分清楚了。再回头看看中国辛亥革命
后期，由于几千年社会认同的中国皇权制度被彻底推翻，就曾经出现了长期的社会
震荡和军阀混战局面。后来，经过长期的动荡后，用暴力、血汗才重新建立了一个
新的、统一的社会网络，协调人重新出现。这中间幸亏“国家”和“中华民族”两
个重大的背景协调因素才能重新整合这一裂痕。不信的话，可以看看抗日战争时国
共两党对抗情形。“国家”“民族”利益一直都是最突出的两个因素。如果没有这
两个尺度协调人存在，其结果要么被外部势力分治，要么是国家的长期分裂状态。
从前面分析可以看出，一个N人组成的国家内部，是由众多的联盟形式组成
的。由于每个联盟都代表着一个群体，他们的行为都存在一个虚拟的中心协调人。
那么2”一1个可能的“子联盟”就存在相应的协调人。这些联盟相互竞争、整合成
为一个具有分散倾向的大联盟，最终统一在一个国家尺度上。国家、民族等群体竞
争事实上就是协调人的竞争，因而很容易出现上面所说的“文明冲突”。这一过程
可能能够快速完成，也可能几十年、几百年甚至几千年。一旦协调尺度统--至tJ N人
层次后，我们发现要进行联盟的重新组合是一个多么艰难的事情。
案例1异花授粉植物的策略选择——生态理性的形成
植物的传花授粉过程能否顺利完成，关系到植物种群规模最大化目标‘35Ⅻ。为
了保持种群的最大环境适应性，从而使后代具备扩大到整个生物圈的雄心和能力，
植物必须尽可能多地经历和记忆环境变量。为此，许多植物进化出了这样一种机
制：让雄化和雌花专业化于不同的植株之上，分别去体验不同的环境变迁过程，然
后又通过异花授粉过程重新结合，使受精卵包含了多样化的背景信息。从而使植物
后代保持广泛的适应性和抗逆性，这对保持种群规模的扩张极为有利。然而，植物
通过这种策略虽然“记忆”了比白花授粉植物多得多的环境信息，也使“受精卵”
包含的备选策略集合大大增加，但也增加了一些额外不确定性。那就是，它必须正
视不能顺利授粉的风险。下面我们从收益、风险和协调等多个角度来观看这一游戏
过程。
1参与人集
本对策中的参与人集是采花的昆虫和生殖过程中的植物。昆虫依靠采集花粉生
活，它的目标就是采集到最多的花粉，从而(1)现有昆虫种群提供丰富的食物来
源； (2)帮助植物完成授粉过程，从而通过植物种群扩大来保证自己种群的可持
续性； (3)昆虫的决策与植物决策是独立的。
植物的世代交替过程包括营养生长和生殖生长两个阶段，它的目标是最大化植
物种群规模。因此(1)它最大限度地保证生殖过程顺利完成； (2)为保持种群可
持续性，它必须尽量多地体验环境信息，从而保持后代的适应性。(3)植物需要
借助于外部媒介：水、昆虫、风等，媒体与植物之间是相对独立的。(4)生殖过
程只是整个生命周期中的一个阶段，各阶段相互依存。因此，植物不能无限期的等
待，且不能消耗太多的营养。因此，它是短视的且是追求成本最小的经济人形象。
2环境信息集与策略
1)环境策略集合：假设环境策略变量为o={abca⋯J弘)，它由26个字符构
成，从而可以形成2”一1种小生境【36】。。其中的符号abce⋯xyz分别代表温度、光
。在生存竞争中，种群规模最大化目标生态学家的一个基本假定．这与经济学的假定并无本质不同。在博弈
论、产业组织中的进化研究法，优化方法中的遗传算法等也是摹拟这一过程来进行的·因此，本文引用的案例
和假定原则上适用于经济过程的分析．
。星境足指生物环境因素的集合．这种组合非常大，但一般来说，某类植物只要有几种关键因素组合出现(如土
塘。气温、光照、降雨等)就能保证种群的生K。
照、降雨等环境变量。变量的任意一个组合都代表一种生态环境，它们综合决定了
植物的生物学和生态学特征。
2)植物策略现在假设有一种植物，它在基因层次已经记忆的环境变量是下面环境变量集合为：0。=(删)。即这四种变量组合能够足以保证完成植物的生
长条件。但是，该植物并不清楚自然界还有那些策略是否适合其生存或生存条件比
o。={昭w办更好。于是它用三种方式去试探。
(i)单一稳键策略即只按照自身已经记忆过的方式去体验。如果雌雄植株共同
生活在一个不变的环境中，我们可假设它满足这个条件。在自然界中，植物自花授
粉可假设是这一策略的代表。这种策略体验的后果是，下一代记忆的环境信息集合
与祖辈相同。即：01·=(qgⅥ们，显然它的后代没有长迸。
(ii)混合策略即，植物为了保险，它按不同的比例去体验环境信息：
011；{agwy}，@12={abcdewy}
其后代信息集合为：olI+012=oll V@12+oI{^012，增加的环境集合为{bcdeh)。
一般我们假设，混合策略将使子代更能应付环境的挑战。
(iii)单一风险策略植物只求尽量多地经历不同的自然环境，从而增加应对环
境的策略集合。这种策略就是让雌雄花分别去体验环境信息，一旦雌雄配子能够交
配，后代将具有更多的应对方案。设两个个体基因记录的环境信息为：
0Il={aghijwy}，012={abcde．[kwy}
那么一旦传花授粉完成，后代的环境信息集合为：
0ll V 012={bcdefgho'kwy}，0II^012={awy)
此时，植物因具有相应的备选策略，因而在一个更大的分布范围内它将具有立足之
地。
3不同镱略下的收益与风险
1)单一稳健策略
这种策略的收益为：p(．)=击。它的对应风险为可=0。由于不需要借助于昆
虫，昆虫收益为0。但是，这种植物由于缺乏足够的环境体验，在自然选择和空间
竞争下，它只能占据一个较小的生存空间。当环境因素趋于无穷大时，从PO可以
看出，它的生存空间将会被挤压到接近于0。
2)混合策略
这种策略的直觉意义相当于股票投资者，它建立一个风险投资组合，不把鸡蛋
放在一个篮子里。此时，在个体竞争上，它能够保证生殖过程的顺利进行；在空间
竞争上，它也能占据较大的生存空间。由于收益变量为：
v(abc)=l，v(ab)2l，v(ac)=O，v(bc)=O，v(a)=v(b)--v(c)=O
所以它的个体收益为p(．)=-(5，5，2)，个体风险为q=1～(吾)2(击)。在气候过渡地
带，我们将会发现大量的这种植物种群。
3)风险策略
这种策略的收益为，由于v(abc)=l，v(a)=v(b)=v(c)=v(盯)=v(a_b)--vfoc)=o，所以
p(．)={(1，1，1)，但是风险是共存的g=(1一；岳)3。
植物追求环境多样性而分别去经历的方式也带来了比自花授粉植物多得多的风
险，这些风险主要表现在以下几个方面： (1)假设雄花与雌花比例在总体上是合
适的，但由于生殖隔离和生态隔离，或者分布在不同地区，授粉不能完成。(2)
由于雌花和雄花分别生长在不同的植株上，如果种群中没有合适的雌雄比例，传粉
的不能完成： (3)即使种群中有合适的雌雄比例，但是如果雌雄花期不一致，传
花授粉的目的仍然不能达到： (4)传粉过程必须借助于一些媒介：昆虫、风、水
或其它条件。这相当于引入了更多的参与人，因而会出现收益分配问题。因为对于
一个理性参与人来说，当它的收益不能得到保证时，它会放弃合作行为。
4植物与昆虫之间的讨价还价
以虫媒植物为例。如果雌雄花同时开放，但如果昆虫在此时不出来采花(可能是
昆虫不存在，也可能是它们没有观察到稳定的可依赖的自然信号，如温度不合适、
光照不充足等)，传粉过程照样不能进行。对于动物和植物来说，我们假定它们相互
之间除了自然信号作为交际语言外，彼此之间无任何其它的方式进行通讯。那么对
于独立的三个决策者雄花、雌花和昆虫之间，这三个条件各自是独立的，所以，以
eqb．C分别代表雌花开时有雄花出现的事件、雌雄开化时间一致事件和昆虫与花期同
时出现，d代表授粉完成这一事件。p(口)，p(c)分别为事件出现的概率，由于各个
事件是相互独立的，既中间无任何协调人出现情况。那么：
p(d)=p(abc)=p(a)p(b／a)p(aIbc)=p(口)p(6)p(c)。在此情况下，传花授粉过
程是随机的过程。
4．1对称博弈
假设只有一种植物和一种昆虫。植物只依靠某一特定昆虫传粉，昆虫也只依靠
某一特定植物。此时，博弈三方都别无选择，因而各方是对称的。其特征函数(支付
函数)是：
28
V(口)=v(b)=Kc)=v(ab)=v(bc)=v(bc)=0
v(abc)=1
即任何一个参与人单独行动或两两行动都将得到收益。其生物学意义是，
(1)当雌雄花不在同一地区或分布在不同时间上，昆虫虽然能暂时采到花粉，但
由于植物不能顺利完成生殖过程，最终将无花可采。(2)雌雄花在同一地区同一
时间相遇，但昆虫不出现。此时也不能完成授粉目的； (3)但只要三人一起行
动，那么植物种群将不断得到扩大，昆虫种群将也会因有源源不断的花粉而扩大自
己的种群。显然，三个参与人的讨价还价势力是相等的。
妒={丸，丸，如}={{l，1，1)
4．2不对称博弈：昆虫多样化策略
上面假设昆虫只依靠于一种花生存。显然这种策略对于昆虫来说有些吃亏，因
为昆虫具有更大的活动空间，且植物多样性使它完全可以采用多样化策略。因此，
它倾向于在植物中引入竞争机制。
假设昆虫也有两种策略，专～策略和多样化策略。专一策略是只依靠单一植物
花粉生存：混合策略是依靠多种植物生存。此时昆虫将有更多的选择空间，因此它
不会把所有鸡蛋放在一个篮子里，而是选择多种花粉生存。假设同时有两种花开
放，植物之间将出现竞争，其特征函数为：
v(abc)=l，v(ae／b)=O，vCoe／a)=l，V(be／a)=l，v(a)2VCo户-vCelFO
各方的夏普利值为，；(1，2，1)。
这使昆虫在博弈中具有重要的优势，因此花儿必须给予更多的报偿才能吸引到
昆虫。不过，这一步自然界要通过非常长的时间来计算。
假设昆虫能够在任意的时间和地区活动，而植物又是过度竞争性的，将导致昆
虫具有完全的竞争势力。此时，植物会给予更多的报偿才能吸引昆虫来传粉，例如
它会更香、更鲜艳、产生过多的配予以及避免在时间、空间上过度拥挤。或者说，
它会通过多样化策略来缓和竞争，结果使植物充满整个生存策略空间。这就是为什
么热带植物会出现异常多样性的重要原因之一。
5 植物与昆虫之间的通讯与协调
上面所说的是，动物和植物合作时的收益是最大的，并且确实出现了自然合作
行为。然而问题在于，它们是如何走向合作的?因为从生物学意义上说，这几个参
与人之间彼此都是相互独立的，他们之间根本无法进行通讯和协调。是什么机制才
能导致这一生态理性的出现?那一只“看不见的上帝之手”是什么?
华中科技大学博士学位论文
===============；===========；=============一
5．1显示原理与协调人
从显示原理可以看出，植物、昆虫之间必然存在一个中心协调人。这个协调有
就是气候变量。即植物和昆虫都与气候签订～个合约，然后再按约定的方案进行博
弈a这个合约是这样的，如果气温光照达到了某一条件，雌雄花将同时开放，昆虫
也准时出来采集花粉，就能保itT．p(a)=p(6)=p(c)=l。也就是说，雌雄花能够同时
在时间上、空间上相遇，昆虫也正好出来活动。如果任何一方违背合约，都将错失
良缘，收益变为0支付。
不过，气候不是唯一的协调机制。例如，三个参与人同时观察到了自然信号，
但如果雄花、雌花和昆虫不在同一地区的话，问题依然很严重。我们来看植物是如
何处理这一矛盾的。
1)自然地理分布趋向一致
给定植物不能主动寻找昆虫这一事件，加之许多昆虫并非单一于一种花粉，这
导致昆虫势力上升。所以，为了保证传粉的顺利完成，植物必须作出妥协：即同一
物种总是生长在气候条件相近的环境下，这就是为什么会出现植物自然地理分布不
一致的原因之一。生态学家不仅观察到了这种聚集现象，而且发现了植物和动物在
分布上的相关性。
2)多样化策略
在市场竞争中，厂商之间缓和价格竞争的方式之一是多样化策略，多样化策略
可以避免过度“拥挤”问题。在生物进化论意义上，这种策略也被植物广泛采用。
为了避免植物在时问和空间上的过度拥挤，不同种类植物会尽量避免在时间和空间
上均匀分布，以便充分利用外部资源。例如，不是所有的花都集中在春天开放，而
是花期错开、延长花期等措施回避过度竞争；同时我们也发现，植物会出现径度、
纬度和高度上的多样化格局以回避空间的过度竞争。
3)信号标识
植物可能尽量标识自己，策略地向环境提供具有吸引力的信号，从而吸引到更
多的昆虫。这种信号就是使花开得更鲜艳、更有特色，产生特有的香味，通过过度
繁殖度(大量的雌雄配子)来保证授粉率等，从便满足具有更多、更大选择范围的
昆虫的需要。由于植物生殖过程要消耗大量的营养，因而我们也可以把它看作是一
种补偿过程，或者植物承担相应的成本支出。
5．2协调及协调人的寻找过程
物种之间的协调是一种自组织现象，它通过多样化策略与局部单一策略相结
合，来保证总体风险最小下的收益最大化。这是在长期的进化、适应和自然选择过
[30
程形成的生态后果。物种的进化过程是一个充满冒险的历程，它像在鸡蛋上行走，
每一步都胆战心惊。但是，终极后果是，经历一个漫长的自然选择和生物进化过程
后，它们会寻找到自己的协调人。这一步骤是这样的：
1)假设在进化的每一期初，某种植物在地球上的变异概率是等概率的，这样
我们可以保证植物能够面临2”一1种生境，即植物对环境具有完全的信息。
2)每种生境只能保证最能适应的植物种群被保留，而其它的植物将被排挤。
最终的极限是，适者生存，不适者淘汰。
3)如果我们用矩阵的行代表生物种类，列代表生境类别，那么我们发现，凡
是能够匹配的将暴发式成长，直到充满整个空间；凡是不适应者被彻底排除。这样
植物完全寻找到了自己的协调人：凡是能够在某一列保留下来的生物，它们之间具
有一个共同因子。这个共同因子就是生态环境集合，它是群体的协调人。一般来
说，这个协调人是土壤、气候、植被等因子的一个组合。
在上面的博弈环境下，虽然三个参与人之间因不能相互沟通而可能出现“囚徒
困境”，最终导致各自种群灭绝。然而该博弈内在的福利效果却具有很强的集焦效
应。这样，它们终于寻找到了自己的协调人：自然环境信号。使得其中任何一个人
违背了自然推荐的策略都将得到0支付。因此该策略是满足参与条件和福策略激励
条件的，生态理性出现。
5．3自然选择与基因记忆
在生态选择中，群体合作的激励与参与条件恰好充当了一个过滤装置：凡是不
符合自然推荐的策略，或者任何违约行为，种群规模都将收敛到0。而遵守自然法
则的参与人，种群将暴发成长。这样，通过长期自然选择和进化过程后，植物就能
够记忆大量的环境信息，并通过执行协调人策略来保持种群的扩张。这些信息最终
稳定地记忆在基因层次上。下一次，所有植物就按记忆中的规则行动。自然界的和
谐和生态理性随之出现。
5．4 自然策略不稳定与协调失灵
复杂的协调过程需要自然协调人必须严格遵守游戏规则，否则生物体将会由于
自然策略的不稳定而陷入混乱。例如在中国中部地区，桂花在正常年份应该在一9月
份开花，这是通过识别自然界光照和温湿度信号方式进行的。然而在2002年，由
于气候出现异常，导致桂花罕见的出现了四次花期，其中在“三伏”天开花更是少
见。这种过分敏感的方式对于植物来说，潜藏着极大风险，因为，(1)突然的气候异
常可能导致授粉条件不能同时出现，因为生物既识别平均温度、极温信号，同时又
识别积温、湿度和光照信号：(2)植物在生长期的不同阶段是根据不同的自然信号序
贯行动的，因此即便能够传花授粉，但由于后期的条件不具备，也不能达到种子正
常成熟的目的。(3)植物开花是～次冒险试探，这种试探的风险是外部条件是否具
备；它也是代价昂贵的试验过程，因为每一次花期，植物都要消耗大量的营养。如
果一年中多次开花，不仅会影响自身的生长，而且还会导致抗寒、防病虫害能力下
降，结果将导致竞争力下降，最后不得不退出生态系统的博弈过程。
气候的异常变化最终会导致某些物种的灭亡，从而破坏食物链、食物网结构，
结果使生态平衡遭到破坏。气候异常也会改变作物的自然地理和经济地理分布，结
果使农作物或自然物种的分布发生变化。气候异常还导致某些疾病发生的地域结构
和时间结构变化，从而导致人口的健康水平、医疗支出发生结构性变化。气候异常
往往伴随着自然灾害的不确定性，因此对于灾害预防的经济水平的确定出现困难。
因此，一个自然协调人的策略不稳定性，通过自然食物网和经济网络传递和扩大其
影响，最终影响到经济的各个方面。
案例2价值与风险的“时间拥挤”现象
1时间的价值与风险拥挤现象
人们从观察经济表现的时间过程中发现，“当一些经济变量不为人们注意时，
它的行为是正常的。但当它一旦为人们所注意时，它的行为就变得越来越不正常
了”UO)]o这种现象被称为古德哈特定理。它指的是货币供应量作为政府干预经济
政策变量时的情况；诺德毫斯(1973)【10明的政治经济周期模型则重现了尼克松时
期的政治经济行为，从中可以看出，政治家为了选票，是如何人为的造成经济周期
性波动的；更一般地，我们把人类群体行为中的重要事件看作是一次冲击的话，那
么它将从不同角度上通过影响群体选择来间接影响宏观经济水平和结构。如一次政
治峰会、体育活动、文化节日等。其中，有的是周期性并且是可以预测的，有的则
是意外的随机冲击。那么群体行为为什么会非常集中于某一特定的时间?
1．1时间价值的异常表现及特征
1．1．1价值与风险的时间拥挤
观察时间对经济的微观冲击或经济系统对冲击的响应方式是十分有趣的。
Tirole(1986)列举了一系列时间拥挤的案例I104]，如经济区域拥护、电视频道广告的
时间集中等。在日常事件中，我们也发现诸如周末消费、假日经济、上下班及用电
用水的峰谷现象、股市的元月效应等拥护现象。这些现象都不是偶然的，因为经济
现象的背后都有与之相适应的结构性因素来支撑它。这些结构因素就是一些代表性
的群体，它们能够把某些冲击扩大化、持久化，从而使经济行为集中在某一时点或
时段，使时间的价值和风险不能消散。从表(10．1)可以看出，周末或节假日时，
经济行为表现是多么异乎寻常。经济在时点上不仅表现为价值“拥挤”，而且风险
及与风险管理相关的行为也非常集中。
表10．-1时间的风险拥挤
典型事件媒体关注
1．传统节目春节、中秋节、端阳节等疾病、偷盗、抢劫、火灾、车祸：消费拥挤排
队增加。
2．重要假日寒假、暑假、五一、十一消费拥挤与排队、交通事故、疾病现象增加
3．重大活动体育活动、重要会议、公众公共安全报道，政府安全通告。
聚会
4．职业特征职业转换点“五十九岁”现象、毕业生求职高峰。
5．昼夜变化上下班及休息时间用电高峰、交通高峰出现拥挤与排队
华中科技大学博士学位．论文
上表是从一些报纸上提取的与节日或事件相关的一些风险拥挤现象。从中可看
出，在不同的时间定义上，某些时点或时间上风险分布异常不均匀；而下表(10—
2)则显示了节日中的消费行为特征带来的价值拥挤。
表10．2一般节日的消费活动
低价值的节日商业消费活动
个人生日主要是家庭记念活动，包括聚餐、娱乐支出．鲜花、种类礼品
教师节(9月9日) 学校、政府组织的活动．消费主要是一般礼品
五一节(5月1日) 主要是旅游、运输行业、商业的拥挤．公共部门一般有重要活动
中秋节(农历月15) 旅游行业、商业拥挤，有吃月饼习惯，月饼厂商依赖此节日
端阳节(农历5月初5) 消费集中在娱乐和饮食业，如果与其它节日重合，旅游拥挤
国庆节(10月1日) 旅游业、消费、交通运输业拥挤，公共部门有重大活动
清明节种类记念性活动
重用节(老人节，9月9日) 各类消费活动，不具典型意义
六一节(儿童节) 旅游、购物、聚餐等活动．
学校寒暑假旅游、购物活动．
1．1．2时间价值与风险的表现特征
时间价值与～般的影响经济的变量相比有许多特征。(1)许多时点上的价值
与风险具有稳定的行为表现，它能较好地协调人们行动，因而是可预测的； (2)
它具有极端的风险表现与经济机会，使经济出现周期性波动。(3)价值或风险缓
慢积累能量，集中释放，是一种特殊的有规律的生灭过程。(4)文化、政治或其
它事件，由于群体的认同关系，因而能对群体行为进行预期协调。(5)它往往具
有区域、国家或民族差异性。从而使以时间拥挤形式表现了文化经济价值、政治事
件的经济价值。(8)经济主体存在着大量的处理这类事件的微观机制，市场中有
一些厂商应运而生，专门捕捉这些异常信息得以生存；政府也对非常价值和风险给
予了高度关注。(7)文化背景深厚或历史上异常事件频繁的国家，不能小看这些
力量。在使用宏观信息时，应注意这些微观冲击，而不能过分依赖均值信息，相应
的信息依赖的决策机制也值得注意。图(10-1)是武汉地区一个商场一年内销售额
随时点而波动的状况。从图中可以看出，如果用年平均销售信息就不足以反映经济
活动的特征。一些特殊的时间如周未、节假日都现峰值。其行为明显异于一般时
间。并且出现周期性波动。
图10-1一年内销售随节日的波动
2．3影响时间价值的力量及时间的不同含义
2．3．1影响群体时点行为的力量
时间价值与风险的拥挤现象非常普遍。作为一个自然度量单位的时间，其价值
与风险为什么会出现如此不均匀分布?到底是什么力量使时间价值如此集中而又不
能消散，从而缓和时间压力?一定有某种力量在协调着人类行为。一般来说，一些
可识别的协调力量有：
1)文化对群体行为的预期协调
时间含有深厚的背景感，它承载了大量的背景因素。对于一个具有五千年历史
的中华民族，时间记忆了许多重大历史事件、历史人物、宗教信仰和民族习惯。这
些因素是通过大群体以特定的节日形式，在重复过程中才保持了这种记忆能力。这
种记忆～旦稳定下来，即使人们不知道它真正的含义是什么，仍然一致性地实践
它。例如我们可能不知道春节的真正起因、它的本来含义，也没人关注它的内含，
但所有炎黄子孙都知道该做什么。今天，国际上为了警示或记念某些事件或人物，
也以节日的形式固定下来。当时间事件被一个大群体甚至整个国家记忆并实践后，
才具有明显的拥挤特征。其实践者是消费者的集中消费行为、厂商的集中生产行为
和投资者的集中投资行为等。
2)政治力量的预期协调
政府是整个社会规则和活动日程的制订者。政府不仅有自己的政治活动日程，
而且它规定了社会行为的时间顺序。从政治活动安排看，政府从各种会议到重大的
经济政策安排都是按时间计划来完成的，这种时间有时可能延续五年或十年，它引
导人们的生产、投资和消费行为预期，从而协调了整个社会的行动。从政府影响人
们日常生活看，它包括政府从上下下班时间安排、各种假期的通知与规定及任何细
节。
3)经济力量
经济力量是多方面的，如国民经济计划、重大投资项目等都附加了时间要求，
从而成为引导和协调人们的预期行为调整，使经济出现了时间拥挤问题。
4)社会事件
一些重在的社会活动如大型运动会，娱乐活动及其它群体活动。
由于社会的生产和生活具有网络外部性，即个人行为完全依赖于群体行为，因
而时间或时点的价值或风险集中的原因就在于人们需要集中的群体活动。例如，当
几种工作相互依存时，多个部门只能集中在特定的时间段内才有意义。而无论是历
史性记念节日或重大政治活动安排，其真正的意义是向所有的人发出一种协调信
号，强化实践者的群体规模从而强化了群体记忆力。更何况在节日里，人们既可以
购买到便宜的产品，厂商可以集中营销，因此以时间或时点进行社会组织，也应该
具有某种节约特征。
2．4群体行为影响时点事件原理
时间分类的不同特征将使时间表现出与自己特征相一致的周期性。在经济周期
理论中，我们一般更注重经济表现的宏观波动及周期性。对于短期的变动因素都进
行了平滑处理，例如季节波动、长期趋势等。这种处理方式在获得信息的同时，把
一些非常有意义的信息过滤掉了。事实上，平均信息中包涵了一些非常重要的信
息，这些信息往往能被更具体的分类主体所识别(如厂商)。这些识别主体对时间
具有的特殊经济敏感性、政治敏感性或文化敏感性，使经济的短期、局部活动水平
引起的波动，最终都对宏观经济状态做出了贡献。宏观经济波动是经济整体的综合
作用的结果，其预测性、或识别性较差，但这些微观活动则更具有可控性、可识别
性，并且可以为政府、市场所策略性地加以运用，为宏观经济服务。
时点事件有两类：一类是未预料到的冲击，这种冲击在经济中往往表现为极端
的响应方式。如2001年发生在美国的“9．11”事件；另一类是意料中的冲击，如国
民经济的种类计划，200年在中国北京的奥运会等。根据理性预期理论，这类可预
期因素因会被预期到，从而使冲击能量分布在一个较长时期内，不会对经济不会产
生短期的剧烈的影响。
有两类比较容易预期和控制的时闻表现行为，因此社会也存在着两类比较典型
的社会群体对时间的响应模式。一类是由历史和习惯传统形成的固定周期性行为；
第二类是按不同的功能性群体定义的时间。两种行为都有相应的代表性群体，因而
时间起到了预期协调群体行为的作用。设群体的规模为So，某一节日或时点t．所代
表的群体比例为p(t。)，则群体的潜在价值：
1)V，=80p(t．)，0≤p(t，)≤l，这种价值可能反映在生产活动、消费、政府等活
动的价值与风险。
O．r__L≥o，墨≥0 (10—6)
丞o ’印(f。)
、。
2)假设在某一时点，有多种节日重合，那么节日的价值可以看作是：
V=ΣJ。p(，，)。因而从需求角度来说，人口规模越大，节日的时间价值越大；人
们对某一时点的认同越集中，冲击效果越明显。像春节这样的节日，所有的人都卷
入相关活动，对经济冲击是显而易见的。
3)如果把时点经济活动水平作为样本，进行虚拟变量相关分析，那么我们可
以求出某些时点的价值判别函数。
式中，k是待估参数，它代表节日的价值。P，为误差，假定它是独立同分布
的。记：
r=[；：]，E=[至]，x=p，c，，t，，B=
则线性模型可以以下矩阵形式表示为：
y=X君+E (10—8)
依此方程进行线性回归，得到各个具体的参数。从而可以对时点建立一个“货
篮”(表10-．4)。对这个货篮分析会得出许多有意义的结果。
∞ 乃
+
肚4U 々涉
"
～r厶H
一芝矗
K
净
I
2
．
^
．
i
．
．
_ “％～钆～吒～～‰
华中科技大学博士学位．论文
表lO一4时间价值及风险管理“货篮”
＼时间历史事件政治事件其它事件时间价值集＼ (XI) (XIJ) (Xu)
时间价值
风险中区域
H H n X．各个
001(元旦) Σ6Ixi Σ巧一Σ巧_ 占=ΣΣ谚x，
f。I 卢} f2l 部f J
385(12月H ^ n
30日1 Σ4t Σ点‘ Σ4‘ 占=ΣΣ4x．
‘tI ‘。l ，。l
上表是一个按天累计的时阿管理“货篮”，纵行代表第385天，横行代表每天
可能发生时间事件。那么相应的价值和风险都反映在一个表格中。下图一是从一个
小商场取得的销售额计算的节日相对价值。表中是对节日的销售额与月平均销售额
之差后进行聚类分析得出的。从中可以看出，春节具有最大的节日价值。而其它节
日也与平均月水平有很大差距。
2．5经济价值与风险时间拥挤现象的实际意义
1)从时间拥挤的原因中可以发现，它是文化、政治及其它可预测的稳定因素
在协调群体行为，因此它体现的是文化、政治等因素的经济价值和风险。特别地，
由于各个民族都有不同的文化传统，因而由文化引起的时间拥挤具有不同的特征。
在一个消费导向的经济体系中，文化传统成为引导人们生产消费行为的一个特殊来
源，其作用正如政府使用宏观经济政策引导人们预期，从而产生预期干预效果一样
有效。从这个意义上说，文化即财富。相应地，文化传统的逐渐丧失也将会影响到
经济的消费、生产等结构性特征。
其它节日口口
圣诞节口口
重阳节口口0口
周末[I口0口口
暑假口口口口c口‘：二㈠M乙
六一口口口口口E二2川：一i·
十一9口0口口3口j门
寒假0口5口0c王Pd二。一一
五一口口口口口LEi一] 一■
中秋c口=已[二=[
元旦■一：。。一-一
端阳节『‘一r’【一
春节：【=I
2)如果我们要求经济具有均衡的时间表现，防止经济大起大落，那么就应该
对时间进行均衡管理。防止一些人为因素推动经济大起大落。美国七十年代后，就
认为经济的政治周期是违法行为。而对我国许多在“长假”可以推动消费的观念
下，人为地促进某些消费的拥挤和社会生产的结构性中断也未必是合理的。
3)时间有价值必然会有相应的社会套利机制，如股市随着相关事件的涨落、
商场的节日促销活动、生产厂商针对特殊节日为目标消费群设定的生产活动等。因
此，一个具有开放自由的市场不仅会从中套利，稳定地保持时间价值的稳定性，而
且决定了相应的经济结构。
4)宏观特征。正是由于自然因素、政治因素及文化因素导致的对群体活动的
行为预期协调，它充当了一个重要的冲击传导机制和放大机制，因而微观尺度的时
间价值最终都会合成为经济中的宏观力量。识别时间价值和风险不仅有助于政府的
微观和宏观的时间管理。
5)动态性。集中在某一时间上的决策行为可能会影响未来很长时期的经济动
态。我们往往忽视了一些今天或昨天发生的小规模群体决策现象带来的可能后果。
例如，十二生肖本来对人们行为无任何影响。但是附着其上的禁忌却能显著改变人
们日常决策行为。尽管2002年所谓的“寡夫年”和2000年“属羊年生小孩不吉
利”的传说毫无科学依据和统计上的证据，但人们的认同却相当普遍。结果导致
2001年结婚相当集中。这种迷信引起的决策行为不仅影响了当年，而且可能影响到
未来经济流量变化，如小孩就学上的拥挤、就业拥挤等。
时间作为一个非常自然的度量单位本来应该具有均匀的行为表现。既经济价值
与相应的风险应该在时间上是均衡分布的。然而，当不同时间上存在着代表不同群
体的协调入时，参与人之间虽然不能直接沟通通讯采取一致行动来获得合作收益，
但是只要以时间信号作为自己的协调人来确定自己的固定策略就可以完成。由于这
种策略具有较好的内在福利性质，因此任何人偏离协调人推荐的策略都不是最优
的。例如，中秋节厂商的生产和消费者消费。
39
案例3文化协调作用的消失
文化在协调群体行方面起着非常重要的作用。作为背景协调因素，它的真正意
义在于：在参与人集N中，总有一类代表性群体s∈N认同某种文化规范，共同行
动。从而使得：
V(s)=1，v(s—f)=0，f∈5，s∈N。
即，当J个参与人一起行动时，他们都将获得正收益，否则就得到0支付。这
类群体行为是众多群体行为中的一种，它的特别之处是：(1)它是人类社会通过长期
互动过程形成的处理日常行为的共同准则，因而它是进化稳定的；(2)文化准则避免
了人们没完没了的讨价还价过程，从而节省了大量的交易费用；(3)文化是建立更高
级联盟的基础，在许多国家中，一个具有典型特征的民族事实上具有一个联盟特
征，在此基础上合成为一个更大的联盟。
如果群体均匀地分散在一个更大的范围之内，直接通讯和协调行动都将非常困
难。但是，依托于文化背景，相当于大家共同使用一种语言进行通讯。从而大大缩
短了群体之间的距离，也增加了社会网络的密集性，结果出现了小世界现象。
不同群体在长期互动过程中形成了一些共同遵守的处理问题的规则，因此简化
了解决问题的办法。然而，在全球化和民族多样性的环境下，文化作为协调群体行
为有时会面临两个重要的困境。一是文化在传递过程中，由于特殊事件导致文化的
突然被中断，例如，传承中华民族的文化传统在20世纪中期的文化大革命中就出
现了中断情况；二是在一个文化快速融合的时代，某种文化的代表性群体迅速异质
化问题(深圳)。
我国已经经历过文化大革命时代。由于文化是通过群体互动过程来保持“遗
传”的，当一代或两代人不能正传承时，就会导致文化的代表性群体的逐渐消失。
文化本身具有“全息”138]o性，一个“为文所化”的过程是一种社会规则的内部化
和制度化过程，它与言传身教、日常饮食起居、制度性激励、各种礼义仪式密切相
关圆。没有经历过背景熏陶的人将会逐渐丧失部分文化信息，从而从消费、生产、
。这里的“全息性”是指在某一文化背景熏陶下成长起来的人，在面对某一文化结构时．会把许多背景知识结合
起来进行理解，因而具有较完整的文化信息．而通过书籍、语言等形式保留的信息是经过筛选过的信息，它不
是全息的。
。一个典型的例于是现代学生对‘红楼梦)的解读．作者曾经对21个阅读过该著作的学生进行过调查，以了解
读者的认知背景．结果发现，由于背景知识限制，导致学生有选择性阅读的学生达到90％，而完全阅读豹不到
10％．选择阅读的重点足“故事情节”导向的．80％学生对其中的诗词、游戏不感兴趣；lOO％学生对礼仪、仪
投资及各种社会形式丧失文化的记忆能力。即：v(j)=O，e J，JeⅣ。所以在上面所
分析的文化价值中，凡是与文化相关的时间增值全部变为0。
文化的协调作用的典型例子是中国传统节目八月中秋的月饼交易活动。对于炎
黄子孙来说，Jk；l十五的共同语言就是“月饼”，从而导致了在这一天或前后的集
中消费月饼的习惯。但是，人们消费月饼并不是因为月饼的一般消费意义上的，而
更多的是文化意义上的消费。
一般来说，一盒月饼的成本价格一般在10．100元之间。作为一般的消费品来
说，它应该依市场需求状况在成本以上不远处波动，并且应该是相对稳定的。但是
不知我们文化传统中曾经究竟发生过什么重大事件、人物或其它值得记念的事情，
导致了人们在这一天集中一致的消费活动，而根本不去考虑它的来源、消费的合理
性等问题。不仅月饼价格窜升到离谱的地步，而且许多人并不是真正去消费它。因
此在一般的消费决策理论中，就有一个重要的因素进入了效用函数。这个函数可以
设想为一个虚拟变量(0，1)，当时间f={8．15}时，消费量v(0>-0，
v(『＼8．15)=O，，=1,2，¨。这样的时间点还有很多，从案例2的分析中可以看到。显
然，一旦代表性群体消失时，所有附着在这些时间上的价值都将取为0。
另外一种情况是文化在快速融合过程中可能出现的问题，我们用最具代表性的
地区深圳为例来说明。
深圳是中国最有代表性的地区。由于它几乎是从一个荒地上成长起来的城市，
大量流动人口使之群体具有真正的“中国”特征。社会学家一般用人们生活习惯的
相似性来判断一个群体的相似性，如果这个群体的许多习惯是相近的，我们说他们
之间的“距离”就是小的，否则就存在巨大的社会距离。识别群体相似性的一个重
要标准就是饮食习惯的相似性，我们称之为饮食文化。一个多样性的群体消费文化
必然伴随相似的供给厂商出现，这样我们能够从饮食业的特色来判断群体的消费习
惯。这比较好理解，因为一个企业之所以能够生存，必然有相应的顾客群的支撑。
如果厂商的收益v．(s)≥O，∈s，s∈Ⅳ，我们说它是满足参与条件的。在深圳，表
面上看，人们的地域观念、文化歧视现象并不严重，大家都是五湖四海的来客，因
而相对宽容。但是，饮食文化仍然泄露了群体的不均匀性。比如，从语言上你可能
分不清个人的偏好、宗教信仰、籍贯等文化特征，但是在所谓“粤菜馆”、“湘菜
馆”“川菜馆”中，你将很容易发现群体的地域特征了。但是，这些厂商是如何起
到协调作用的呢?
式描写不感兴趣；对其中的传统文化部分的基础知识，如干支记年、物候之间的关系普遍缺失；而对人物的农
若、语调等，只依鞍干电视形象．因此，文化的背景缺失是导致个体认知选择的重要原因·
14
事实上，在一个n类群体n类厂商的矩阵中，由于消费者选择过程，结果所有
顾客群都将被吸收到对角线上，分别为自己的协调尺度所协调。由于深圳人口具有
广泛的地域来源，它的协调人应该是多样化的。确实，在深圳你可以看到各种各样
的餐馆，如川菜、湘菜、粤菜等应有尽有。而在一些相对均匀的文化群体中，要想
消费到与该群体不一致的产品时，原料、厨师、厨具等条件都很难配备，相应的这
类厂商的多样化就受到了限制。这正是文化把一个大分散群体分类为几个不同类型
的顾客群的结果。
42
案例4政府政策随机化
一个成熟的政府行为最集中地体现在财政和金融政策的使用上。货币发行量和
财政支出流量结构是政府引导经济行为的重要两个宏观参数。然而，政府还有一系
列相关政策对群体行为进行引导，而这种作用长期以来一直未受到重视：对群体的
微观行为的引导作用，例如日常上下时间的安排、节假日安排等。
政府政策的一致性是宏观经济中普遍受人关注的一个话题。虽然理性预期理论
断言，一个能够被预期到的政府行动变化将会由于人们预期来抵消政府政策影响，
从而不会显著影响产出后果。然而“预期”本身是建立在一整套相关变量的相互影
响规则之上的。有时，政府会故意引导人们的一致预期并为自己的政策进行承诺。
但是一旦政府出现了随机策略，将会显著影响经济系统的行为。
我们用一个极端例子来说明。货币是一种交换媒介，它是一个国家法定的“经
济交换语言”。任何一种商品都可以通过它把商品的价值表现出来。从而全社会都
以它为协调基础进行着各种交换活动。这样即便人们不需要任何通讯过程，也能进
行正常的生产和交换活动。然而，如果政府突然宣布某种流通货币不再具有法定的
货币意义，或者政府突然发行市场不认识的流通工具，整个社会交易便回到物物交
换水平(n人囚徒困境)。
假设社会上有10种商品，他们处于物物交换状态时，可能存在45次相互比较
过程才能保证随机交易的顺利完成。但是一旦中间某种商品成为协调人后，它就变
为货币。这时，任何交易只需两次都能达到。由此我们可以算出它的真正效率。
143
案例5自然策略随机化与灾害预防学
1．自然界策略的不稳定性
从植物异花授粉过程看，植物种群采用自然地理分工策略、通过识别自然信号
进行通讯的方法等，都有一个重要的假设前提：那就是这些信号本身在一定时期内
是稳定的，或具有较好的行为表现。在此前提下，植物就能通过进化、选择和遗传
变异过程记忆下这种单一策略。但是，这一学习过程是漫长的，代价也极其昂贵。
现在我们的问题是，当面临环境剧烈变化时，协调是否还能维持?显然，由于植物
不大可能出现快速的变异来适应剧烈的环境变迁，因此当协调人出现不规则问题
时，协调失灵的问题也就随即出现了。
一般来说，气候、地理等自然信号在一定时期内都具有相对稳定性，因此它是
一个可以信赖的协调人。在生物与自然博弈过程中，自然是一个“富甲天下、万寿
无疆”的参与人，它不计较短期的得失，因此它是一个有耐心的长期参与人。并且
自然的策略空间远较动植物基因层次记忆的策略丰富，因此它更能忍受一个赌徒的
暂时性破坏。然而，由于人类目前对环境的累积性破坏，自然环境具有异常行为表
现已经是一个司空见惯的话题。因此，它不再是一个稳定的、可依赖的参与人了。
自然环境的稳定性一旦遭到破坏，动物、植物种群便由于突然失去了参照系，
整个合作过程便面临着崩溃的危险。加之任何动物植物都是食物链和食物网中不可
缺少的一环，一个或多个物种的灭绝将可能导局部网络“塌陷”现象，这无疑加重
了网络其它链条及节点的负担，最终导致某些种群的异常扩张，另一些种群逐渐退
出生态系统。严重时整个生态系统的平衡就无法维持。
自然策略不稳定也会影响到人类社会本身。不稳定及异常策略导致的后果最典
型地体现在自然灾害方面。一个异常的灾害可以看作是自然界出现的异常策略。这
种策略可能以下面两种方式出现：
(1)灾害有规律的出现，但灾害水平远远超出了人类的预期水平。在此情况
下，由于人类的预防措施就会大大低于“经济预防”水平，从而导致严重的后果。
例如，当洪水出现在正常的洪水季节，我们说它没有违反洪水发生规律。但是，降
雨量却出现了异常，它远远超过了历史记录水平。或者干旱季节按规律出现，但干
旱的程度超出了统计范围以外。这种策略不确定性的后果是，虽然我们能够预防部
分灾害，但我们的防洪抗旱措施是不力的，旱涝灾害出现。
f2)干旱或降雨并未超过历史记录，但出现了不规则现象。如本来是降雨较少
的季节但却出现了异常的洪涝天气。而正常的雨季却出现了少有的干旱天气。这种
灾害的无规律性可能导致我们过度防御或防御不足，前者导致资源的浪费，后者因
难以抵御自然灾害造成经济损失。
2．天人博弈
灾害预防学事实上是天人博弈关系。我们根据自然策略，确定自己的最优预防
水平。在这个博弈中，我们一般假定气候等自然现象具有统计规律。这种规律信息
可以通过历史记录、古气候学、树木年轮等资料泄露出来，为人类所学习到。如果
自然具有规律性、相对稳定性，那么人类就能够通过贝叶斯学习过程学习到相应的
参数。相应地，人类社会就可以按这种统计参数来确定自己的经济预防对策。一般
来说，人类社会有两种基本预防对策：
(1)经济预防对策
这种对策就是根据灾害的出现概率和破坏性程度来确定经济预防水平。例如在
洪水预防中，我们一般是根据灾害发生的频率，来确定防洪工程的规模的。通常我
们取100年到500之间。这种对策在公共工程，如防洪、防震等方面经常用到。这
种对策的实质是，当面临一种不确定性自然灾害时，人类的策略分为两个部分：可
预期的和不可预期的。如果人类不考虑成本约束时，我们能把灾害限制在最小水平
上；如果考虑成本一收益时，我们必须容忍一个经济的灾害损失。因此损失最小和
收益最大主导我们的灾害预防学实践。如果损失最小，防洪标准就应该定得高一
些，否则就定得低一些。
(2)相机决策
即不根据统计规律，而是当问题出现时采取一种灵活的灾害防止策略：当洪水
季节出现时，集中防洪的人力财力和物力去防洪；当干旱出现时集中抗旱；或者有
针对性地重点预防某一区域、群体、项目等。这一点我们可能发现许多案例，例如
每当雨季来临时，中国大江大河所属区域都设立了防洪指挥部作为统一的调度机构
作为组织保证，政府有专用的资金用于防洪设施建设。相应的，对于可能出现洪涝
的地区，医疗、药品、救济等物资都相应配套，以防止次生灾害的发生。
总之一个有规律的可预期的自然信号都会引起社会的策略性反映，从而寻找到
经济对策。现在假设，当自然界出现的策略严重偏离了局中人的预期范围时，我们
说协调人出现了策略不稳定性。这不仅会造成灾难性后果，而且可能使已有策略因
巨大的沉淀成本支出变得毫无意义。例如，当按照一般降雨规律，我们接受自然协
调人的方案修建了一座防洪设施。当自然继续按原来的规则行动时，这种方案是经
济的。但是，当气候突然不再出现原来的规律性，不仅会造成巨大的自然灾害，而
且浪费了大量的经济资源。
案例6气候异常与商业策略
气候等自然信号不仅仅影响植物的正常生理现象，而且也影响到与之相关的
社会经济活动。人类虽然能够改变小气候，从而使我们的生产、生活环境更适合人
类居住，也表现得相对稳定，但是生产、消费活动仍然未从总体上摆脱自然规律的
束缚。如果我们把自然作为博弈的一方，人类的经济或社会活动看作是另一方的
话，那么它们是一场对策局势。并且自然和人类都是对策中的参与人。
2002年中国中部出现的几次异常气候变化，已从微观层面表现出了对经济的
负面影响。以商场为例，商场往往根据气候的自然演变规律来确定正常的采购、贮
备、促销策略，以便经济均衡地安排商业活动，但是2002年的气候异常完全打乱
了企业的正常经营策略。
在一般情况下，一个商场可能通过两种简化策略来满足多样化消费市场需
求：(1)如果客户消费行为是均衡的且顾客群具有同质性，那么消费活动在时间上可
以看作是均匀的。相应地，为满足客户多样化消费需求，商场应该尽量使产品多样
化。(2)如果人群的消费活动具有群体特征且在时间分布上不均匀，那么商场将按群
体消费特征进行经济订购。
经济活动在总体上并未摆脱自然规律的周期性影响，这对处于中部地区的商业
活动来说尤其如此。因为该地区四季分明，从而形成了与之相适应的消费决策和供
应链管理策略。在这个供应链管理中，厂商不需要过多的了解顾客的消费特征，也
不必过多的沟通通讯，而是接受自然推荐的策略：按季节组织生产、商业和消费活
动；消费者也不用担心气候变换会出现商品供不应求的问题。遵守自然法则对厂商
和消费者福利都将是一种“帕累托”改进，而违背自然推荐的策略将不利于双方。
因此我们可以认为，这个合作博弈的焦点仲裁人是气候变量。
现在假设气候突然异常变动，那么厂商和消费者的问题就出现了。例如，当春
天到来时，商场只订购了春装并且收藏冬装。它的假设是，消费群体的消费行为将
依气候变化均衡地过渡到春天。然而，如果气候出现异常，比如春天出现“倒春
寒”或过早地跳到了夏天，商场的问题出现了：春天的货物可能不能卖出，这将影
响到企业的正常资金回流和存货成本将上升；而夏天或冬天的货物又面临着时滞(因
为作为整个社会系统来说，生产商、原料供应商等都是按时间进行的)，缺货损失
也会上升；消费者的福利也将受到损失：消费者面临很多问题，健康支出、衣食住
行结构变化等。同时，规模经济带来的价格下降好处就不能充分体现。
按照经济学原理，消费和生产具有互补、互相强化的性质。当所有消费者都在
某一时间集中消费时，厂商会享受消费上的规模经济效应；厂商会作出适应性调
整，使供给“拥挤”在某一时间上。这样，消费者也会由于厂商竞争导致的产出增
加、价格下降的好处，或者说享受生产上的规模经济效应。但是，当协调人出现策
略不确定性时，厂商和消费者都将丧失这一效应，结果使整体福利都下降。
致谢
艰难的三年终于快过去了，感谢华工为我提供了这次学习机会。我见证了这里
良好的学习氛围和各位导师的严谨学风。由于我的论文跨度过大，显得邪气十足，
因而需要导师以更宽广的胸怀来包容它，并需要冒险精神。然而在写作过程中，我
的指导导师方齐云教授给予了精心指导和充分信任。同时，我还得益于经济学院许
多老师的指导和关爱。在此一并致谢I
刚入学时，我已身无分文。按当时情况看，支撑家庭和学习支出几乎使我不可
能顺利完成学业。但是，下面这些朋友曾极力安慰我，他们将承担全部费用。他们
的唯一要求是，我必须用足三年时间，完成学业。后来，他们确实助我度过了艰难
的时光并谨慎地维护了我的尊严。这些朋友是，深圳建行张国斌、王伟；深圳平安
保险易斌；深圳自来水集团汪海、王同孝；深圳招商银行曾庆群、薛康；广东省地
税局冯绍武、武海艳夫妇；深圳地税局的贺海涛、徐盛刚；深圳招商局吕胜州：中
国社科院数量经济研究所胡洁博士；华中科技大学博士生蒋志永、蔡江卫夫妇；武
汉市政府的张护林、杨振威；湖北省委党校王能应；湖北日报社的王溥；武汉市建
行周光强；701研究所周黎。
陈洪波、李春涛、樊志宏、费剑平等，他们都是我的良师益友。他们的所作所
为，使我充分认识到了人性的光辉，也使我认识到在做人做事上与他们的差距。
谨以此文，献给我的老师和朋友!
蒋天文
致上
200．3年5月于华中科技大学
J47
华中科技大学博士学位论文
参考文献
[1】Oven，G．1982，Game Theory，2nd Ed．New York：Academic Press
【2】Alchian，A．Uncertainty，Evolutionand Economic Ttheory．Journal
Economy 1950，58：21 1-222
【3】Hershleifer，J Economics from a Biological Viewpoint．Journal
Economics 1977，20：1～52
of Political
of Law and
【4】Maynard Smith，J．The Theory of Games and the Evolution of Animal
Conflict．Journal ofTheoretical Biology 1974，47：209—221
【5】Maynard Smith，J．The Evolution of Behaviors．Scientific American 1978，239：
176～192
【6】Nelson R．and S．winter．An Evolutionary Theory of Economic Change．Chambrige，
Mass：Harvard university 1982．1-5
【7】Axelord，凡R．and W．Hamilton．The Evolution of Cooperation．Sience 1981，211：
1390～1396
【8】Axelord，R心m Evolution of Cooperation．NEW York：Basic Books 1984．
231—235
【9】9 Aumann and L．Shapley，Long term Competition：A Game Theoretic Analysis．
Mimeo：1976．1～20
【10】Forges，F．1985．Gorrelated Equilibria in a class ofRepeated Games、vitIl Incomplete
Information．International Joumal ofGame Theory，14：129-150
【1 1】陈学彬．博弈学习理论．上海财经大学出版社，1999，12
【12】Von Neumarm J．Morgenstem O．Theory of Games and Economic Behavior．Second
edition，Princeton，1944
[13】Shapley L1．A Value for N-PersonGame．In：Kuhn H W，Tucker A W Eds．
Contributions to the Theory ofGames，Voi．II．Ann．Math．Stud．28，Princeton university
Press，Princeton,J．J．，】953．307~3】7
[14】Aumann R J．Maschler M．The Bargaining Set for Cooperative Games．Transactions of
the American Mathenatical Society．1998：539·552
【15】Schmeider D．The Nucleolus of a Characteristic Function Games．SIAM J．APPL
Math．1969，17：l 163-1 170
f16】Myerson，R．B．Game theo黟～Allalysis of Conflict，Harvard University Press，1991．
370—510
【17】张维迎．博弈论与信息经济学．上海人民出版社，上海三联书店，1996．273～288
【18】R．W，Cooper Coordination Games-Complementarities and Macroeconomics．
Cambridge University press 1999．146--172
148
【191张维迎．博弈论与信息经济学．上海三联书店，上海人民出版社，1996．2
[20J W F．Lucas Modules in Applied Mathematics．V01．2：Political and Related Modles．
1983．80
【21][美]罗杰．B．迈尔森著．博弈认一一矛盾与冲突分析．于寅，费剑平译．中国经济
出版社出版，2001．295-298
[22]同(2)
[23][美]罗杰．B．迈尔森著．博弈认一一矛盾与冲突分析．于寅，费剑平译．中国经济
出版社出版，2001．297～298
[24】Lucas，W．F Measuring Power in Weighted voting system，1981
【25】Shaply，L．S，and M．Shubik．A Method for Evaluating the Distribution of Power in a
Committee System．American Political Science Review,1954，48：787．792
t26】Banzhaf,J．F．Weighted Voting Doesn’t Work：A Mathematical Analysis．Rutgers
Law,l 956，32：523-536
[27】K．G缪尔达尔．经济理论与不发达地区．1 957年英文版
【28]J．G威廉森(J．G．willianson)．区域不平等与国家发展的进程(1965)．经济发展与
文化变迁，第8页
【29]A．O．赫希曼．经济发展战略．耶鲁大学出版社，1958．323-336
[30】张培刚．发展经济学教程．经济科学出版社，2001．654--682
【3 1]K．J．Butten Urban Economies：Theory and Policy．the Macmillan Press Ltd，London
1976．12肛125
c32】Fisher，the development effect ofcity．Journal ofeconomy．1988，25：235-238
【33】杨小凯著．经济学原理．中国社会科学出版社，1998．319q27
【34】萨缪尔森著。经济学．第13出版，人民大学出版社，1994．457
[35】F．John，J．E．Marsden，M．Golubitsky，W．Jager，L．Sirovich．Dynamics and Bifurcations，
1991，Sprcnger-VerlagNewYorkInc．185-193
【36】张锦炎，冯贝叶．常微分方程几何理论与分支问题，北京大学出版社，2002．144
【37】徐克学．生物数学．科学出版社，2001．215-230
【38】J．Tirole，The Theory of Industrial Organization，Massachusetts Institute of
Technology press，1988．404---405
【39]Braun．M，Coleman and Drew D A．Differential Equation Models，spanger-Verlag．
1 978．328-356
【40】联盟理性是指合作的收益具有可加性条件或超可加性条件．这个条件是合作博
弈的基本假定。参见文献(Oven，1982)
[41】Kalai，E．Nonsymmetrie Nash Solution and Re：plications of Two-Person Bargaining．
International Journal ofGame Theory．1977，65：129-133
华中科技大学博士学位论文
[42】杜平．西土取经一西部大开发的政策背景与商业机遇，中国言实出版社，2000．
367—4】2
【43】郭庆旺，苑新丽等．当代西方税收学．东北财经大学出版社，1997．101—105
[44】Sirnivasan，T．N．Tax Evasion Model，Journal ofEconomic，1973，2：339～346
【45】Allingham，M．and A．Sandmo，Income Tax Evasion：A Theoretical Analysis．Journal
ofPublic Economic．1972
[46】张维迎．博弈认与信息经济学．上海三联出版社，1997
[47】阮家福．税收系统中的博弈过程．税收研究，2001，12
【48】Field，Success and Crisis in National Health System．London：Rufledge．1989
[491 Woodlander,Himmelstein&Lewontin，1993．Administrative costs in U．S hospital，
New Englandjournal ofmedicine，329：400·403
【50】Willi锄Rushing，Social factors in the rise of hospital costs，in research in the
sociology ofhealth care，J．Roth(ed)．Greenwich，CoRn：JAI．1984，3：2弘114
【51】John Knowles，the hospital．in life and health and medicine，San Francisco：W，
H．freeman&company publishers．1973．91-102
【52】Starr．Social transformation ofAmerican medicine，mew York：basic books．1982
[53】Hafferly and W．Light，proffesional dynamics and the changing nature of medical
work，iournal ofhealth and social behavior，extra issue：1995．132-135
【54】MoGettigan,2001．McGettigan P，Golden J，Fryer J，Chan R，Feely J．，Prescribers
prefer people：the som'cas of information used by doctors for prescribing suggest that
the medium iS more importantthanthe message．Brj Ciin Phatmaeol；2001，51：184---9
【55】Wazana A．，Physicians and the pharmaceutical industry：is a gifI ever just a gift?
JAMA；2000，283：373-80
[56】Richard Day，How to make the most of a visit from a pharmaceutical company
representative Aust Pmser；2000，23：97—9
f571 Phillips Kletke，David Emmons and Kurt Gillis， Current Trends in
Physicines’practice arrangement,jou_rnal of the American medical association，1996，
276：555-560
【58]Avorn et al，1982，1987；Poulsen，1992；Avom J'Chen M，Hartley R．，1982，
Scientific versus commercial soUl"Ces of influence on the prescribing behaviour of
physicians．Am J Med；73：4--8
f59】Myerson,R．B．Optimal Coordination Mechanism in Generalized Principal-Agent
Problem Journal ofMathematical Economics．1982，10：67-81
【60】Aumann，R．J，and Shapley，L．S．Values of non-atomic Games．Princeton University
Press 1974
【61】Myerson，R．B．Game theory--Analysis of Conflict．Harvard University Press．1991．
370—510
【62】Axelord，R．(1980，1981，1984)：Reference papers on the cooperation with competition．
Scientific．America 239
【63】Farrell，J．，Cheap talk，C00rdination，and entry．Rand Journal ofEconomics 1987．18：
34～39
【64】Schelling，T．C．1 960．The Strategy of conflict．Cambridge，Mass：Harvard University
Press
【65】Kalai，E．and M Smorodinsky，Other Solutions to Nash’S Bargaining Problem．
Econometrica．1975，45：513-518
【66】Kalal，E．Nonsymmetric Nash Solution and Replications of Two·Person Bargaining．
International Journal ofGame Theory 1977，65：129-133
【67】(a)Nash，J．F．111e Bargaining Problem．Econometrica 1951，18：155-162
(b)Nash，，J．F．Two-Person Cooperation Game．Econometrica 1953，2l：128-140
[68】Lucas，W．F．Measuring Power in Weighted voting system．1981
[69】David Sally,2000． On sympathy and Games． Journal of Economic &
Organization，V01．44(2001)1-30
【70】Shapely and Shapiro N．Z，Values of Large Game I：A limit Thl．eom．RM2649，RAND
Corporation，1961，Reprinted in Mathematics ofOperations Reserch．3(1978)，l~9
[71】Millor，J．W．and Shapley，L．S．Values of Large Game I：Oceanic Games．RM2649，
RAND Corporation，1961，Reprinted in Mathematics of Operations Reserch．3(1978)，
290-307
【72】Selton，A Generalized Nash Solution for Two person Bargaining Games谢tll
Incomplete Information．Management Science．1972，18：80--106
【73】George J，Stigler，1983，The Organization of Industry，The University of Chicago
Press．
【74】Hal R Varian，Microeeonomic Analysis，W．W．Norton&Company，Inc．1992
【75】(法)泰勒尔著．产业组织理论．中国人民大学出版社，1996．337
【76】Willianmson，1985，the Economic Institutions ofCapitalism，NewYork：Free Press．
【77】R H Coase，1937，The Nature ofthe Firm．，4 Economica386(n．S．1937)
【78】Holland J H，1992,Adaptation in Nature and Artificial System．MIT Press
[79】Richard E．Bellman，1957．Dynamic Programming，Princeton University press．
Pewceton，NJ．
【80】Frantz D R．Non-Linearities in Genetic Adaptive Search，Dissertation Abstracts
Intemational，1 972，33(1 1)：5240B～5241 IB．
．华中科技大学博士学位．论文
————————============；=======；======一：：
【8 1]Goldberg D E，Simple Algorisms and The Minimal Deceptive Problem．In：Davis
Led．Genetic Algorisms and Simulated Annealing，Pitman，1987．74---78
【82】张维迎．博弈认与信息经济学．上海三联书店，上海人民出版社，1996．397．516
【83】Harsanyi，J．and Selten，R．1 988．Ageneral Theory of Equilibrium selection in Games．
Cambridge Massachusetts：The MIT press．
【84]Milgrom．the small—world problem，Psyc01．today 2，60(1 967)
[85】Duncan J．Watts&Steven H．Strogatz(1998)．Collective dynamics of‘small．world
‘networks．nature，1998，6
【86】A．L．Barabasi and R．Albert．Emergence of scaling in random networks．Science 1999．
286：509-5l 1
【87】Allen，F，and Gale，D，Financial contagion，Journal ofPolitical Economy，2000，108：
1-33
[88】R．Albert and A+L．Barabasi Statistical mechanics ofcomplex networks．Rev．Mod．Phys．
2002，74：47～97
[89】S，一H．Yoor，H，Jeong，and A-L．Barabasi．Modeling the Internet’S large-scale topology．
r2001)．e·print cond-mat／0107417
【90】D．J．Watts&H．S仃ogms．1998．Collectivr Dynamics of‘small-world’ networks，
Nature 393(1 998)440--442
[91】
【92]
【93】
【941
【95】
【96】
[97】
【98】
[99]
D．J．Watts，Small Words：the dynamics of networks between order and randomness．
Princeton university press，preceton，NJ，1999
O．Diekmann and J．A．P Heesterbeek，Mathematical epidemiology of infectious
diseases：model building，analysis and interpretation，(John Wiley&Sons，New York,
2000
剪伯赞．中国史纲要．人民出版社，1983
<美>孔飞力著．叫魂：1768年中国妖术大恐慌．陈兼，刘昶译．上海三联书店，
1999，l
R．B．Myerson．Game theory-analusis of conflict．Havard University Press．1991．
244～250
Aumann．R．J and H．Drese．cooperative Games witll Coalition Struvture．International
Journal ofGame Theory 1974．3：217—238
Fudenberg，D．and C．Harris，Evolutionary Dynamics with Aggregate Shocks．Journal of
Economic Theory，1992，57：420^441
R．B．Myerson．Game theory-analusis ofconflict．Havard Umversity Press．1991．230
Kandori，M Social Norm and community enforcement．University of Pennsylvania
working papers．1988．1—6
华中科技大学博士学位．论文
Harsanyi，J．and Selten，R．1988．Ageneral Theory ofEquilibrium selection in Games．
Cambridge Massachusetts：The MIT press．
Schelling，T．C．The stratigyof conflict Cambridge，Mass．Harvard University Press
1960：1—5
Schomender．T，simutation games in culture condition，Prenceton university．1 993．
86
Tirole．the influence of information in industriy collusion．MaSS Press．1984，65：
213～234
J．Tirole．The Theory of Industrial Organization，Massachusetts Institute of
Thechnology．1 988．373-374
Maynard Smith．J．The 111eory of Games and the evolution of Animal Conflict．
Journal ofTherotical Biology．1974，47：209～221
参考消息(2002年11月20日)引用{日本“朝日新闻”11月19日文章)：美国
对伊拉克是“文明的冲突吗”?
R．Dombusch，S．Fischer，R．Startz，Macroeconomics(Tth)，1998 by the MoGraw—Hill
Companies，Inc，403404
William D．Nordhaus．The Political Business Cycle．Review of Economic Studies，
April，1975．169-190
咖
叫
叼
叫
嗍
叫
嗍
明
嗍
附录1攻读博士学位期间发表的论文目录和科研成果
[1】樊志宏，蒋天文．纵向一体化理论研究与进展．经济学动态，2003．1
【2】蒋天文．政府生态购买：一个解决生态环境的经济方案．财政研究，2002，9
【3】蒋天文，樊志宏．中国医疗系统的行为扭曲机理与过程分析．经济研究，2002(1 1)
[4】Tianwen jaing，Fang Qiyun．strategically choice and moral-hazards in principal—agent
networks．China Business Review，2003
[5】方齐云，蒋天文．《区域经济之间的互动及“囚徒困境”瓦解机制研究》，第二
届“中国青年经济学者论坛”会议论文。2002。
[6】6 蒋天文，方齐云．《中国医疗保险监控机制研究》，第二届“中国青年经济学者
论坛”会议论文．2002
【7】蒋天文，樊志宏．中国医疗系统的行为扭曲机理与过程分析．第二届“中国青年
经济学者论坛”会议论文．2002
【8】赵曼，吕国营，蒋天文，杨海文．《中国医疗社会保险制度改革与医患双方道德风
险规避》国家自然科学基金研究报告．(／tt准号：79870101)
【9】《人力资本投资与人力资源管理》(第10，第25章)，国家教委与劳动部招
标教材．中国劳动出版社，2002．11
多人博弈中的策略选择与协调
作者：蒋天文
学位授予单位：华中科技大学
本文读者也读过(2条)
1. 谭德庆多维博弈及应用研究[学位论文]2004
2. 徐敏基于博弈思想的优化算法研究[学位论文]2006

ParK's 論文后花園

夫人善於自见，而文非一体，鲜能备善。

2013-7-27 2:10:31

多人博弈中的策略选择与协调

发布:park008 | 分类:经济学 | 评论:0 | 浏览:

Powered By Z-Blog 2.3 Avengers Build 180518

Copyright 2010-2010 ParK's 論文后花園. Some Rights Reserved.