当前位置: 首页 精选范文 博弈论及其应用范文

博弈论及其应用精选(十四篇)

发布时间:2024-03-01 15:48:19

序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的14篇博弈论及其应用,期待它们能激发您的灵感。

博弈论及其应用

篇1

【关键词】博弈论;策略;纳什均衡

一、引言

博弈论又称对称论,是描述、分析策略的一种决策理论。1937年美国数学家冯·纽曼最早把对策论引入经济学。1944年,冯·纽曼和奥斯卡·摩根斯坦(Oskar Margebston)出版了《博弈论与经济行为》一书,把博弈论应用到经济学中,并且博弈论目前已经成为经济分析的主要工具之一,对产业组织理论、委托理论、信息经济学等经济理论的发展做出了非常重要的贡献。博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。换句话说,就是某一经济主体的决策既受到其他经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其他经济主体的决策。博弈论描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。

二、博弈论的概述

(一)博弈论概念

博弈论的基本概念包括:参与人、行为、信息、策略、支付、结果、均衡。参与人是指博弈中选择策略与行动以最大化自身利益的决策主体,其可以是自然人或者社会组织,博弈论中假定所有局中人都是机智和理性的。行为是指参与人的决策变量。信息是指参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识。策略代表着参与者的相机行动方案。支付是参与人从博弈中获得的效用水平。结果是博弈者感兴趣的要素集合。均衡是所有参与人的最优战略组合。

(二)博弈论分类

博弈论可以根据博弈者选择的策略不同、支付结构的不同、参与人行动的先后顺序和参与人对其他参与人的了解程度等进行分类。

第一,根据博弈者选择的策略不同,博弈论主要分为两大类:合作博弈和非合作博弈。合作博弈也称正和博弈,指博弈双方的利益均有所增加,或者至少其中一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。合作博弈研究人们达成合作时如何分配合作得到的收益。非合作博弈指一种参与者不可能达成具有约束力的协议的博弈类型,是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。

第二,根据支付结构的不同,博弈可以分为常和博弈和变和博弈。常和博弈是指各博弈方的得益之和是一个非零的常数。变和博弈也称非常和博弈,是指随着博弈参与者选择的策略不同,各方的得益总和也不同。

第三,根据参与人行动的先后顺序,可以将博弈分成静态博弈和动态博弈。静态博弈是指在博弈中,两个参与人同时选择或两人不同时选择,但后行动者并不知道先行动者采取什么样的具体行动。动态博弈是指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。

第四,根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈和不完全信息博弈。完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。不完全信息博弈是指在一个博弈中,了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下所进行的博弈就是不完全信息博弈。

三、博弈论的基本原理

迄今为止,我们分析企业、个人决策的中心问题是追求效用、利润、收益或产量的最大化。但是,在市场经济的激烈竞争中,人们有时并不追求最大化,而是追求一个相对比较满意的目标。这是因为根据高风险高收益的原理,人们在追求较高目标过程中通常也会遇到较大风险,而一般情况下人们是比较厌恶风险的。因此,人们可能采取一种风险厌恶型的策略,。而最小最大原理就能够满足风险厌恶者的需要,指导人们追求他们相对满意的目标。

最小最大原理要求局中人首先从收益矩阵中找出自己的每一种策略下至少可以获得的收益,也即所能获得的最小收益,然后从这些最小收益策略中选择出收益最大的策略,即从最小收益中选择最大收益。

最小最大原理的合理性表现为不管对方采取何种策略,局中人至少可以获得这个最小值之中的最大值,因此称之为最小最大原理。最小最大原理确保某种收益而不是最高的收益,因而是一种在最小利益中求最大利益的原则。这种策略相对比较“安全或保守”,参与者想确保他起码能够获得某种数量的收益,所以,参与人按照这种原则所确定的策略也叫做稳妥策略。[1]

四、博弈论的应用

(一)博弈论在生活中的应用

生活中存在很多博弈论的身影。比如我国的“田忌赛马”的故事,就是典型的博弈论,说的是齐威王与大将田忌各出三匹马,一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙胺给田忌出主意,让最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2:0取胜。

还有一个关于纳什均衡博弈论的很经典的例子就是智猪博弈。在现实生活中,很多情况正如上面两个博弈论例子所遇情形一样,没能真正实现自身的最佳利益,甚至是损人不利己。从“纳什均衡”的普遍意义中,我们深刻地领悟到经济、社会、国防、管理和日常生活中的博弈现象。[2]

(二)博弈论在经济管理中的应用

自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为以价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质[3]。

如今,我们经常会遇到各种商品价格大战。根据纳什均衡博弈论观点,各商家价格大战的结局即为一个“纳什均衡”,且价格大战的结果是谁都不赚钱。因为博弈双方的利润正好为零。竞争的结果具有稳定性,即一个“纳什均衡”[4]。这个结果可能对消费者有利,但对厂商来说是灾难性的。所以,厂商实行价格大战意味着自杀。[5]事实上,完全竞争状态下的均衡即“纳什均衡”。

此外,假如市场经济中存在污染,可政府却没有管制的环境,企业为了实现利润最大化,宁愿牺牲环境,也不会主动增加对环保设备投资。依据看不见手的原理,所有企业均会从利己角度出发,采取不顾环境策略,即进入“纳什均衡”状态。

五、结束语

博弈论在理论上进一步拓宽了经济学研究的领域和范围,在现实社会中被应用到各领域中去。入世以来,我国参与全球经济一体化,采取扩大内需,积极推进“走出去”的原则,如我国成功地举办了2006年“中非合作论坛”,博弈论的“纳什均衡”体现得恰到好处,实现了双赢的目的。

参考文献:

[1]汤学俊,吴进红.中级微观经济学[M].北京:经济管理出版社,2004.

[2]赵凌云.经济学通论[M].北京:北京大学出版社,2005.

[3]K·F·齐默尔曼[德].经济学前沿问题[M].北京:中国发展出版社,2004.

[4]周林洋.博弈论与纳什均衡理论[J].金山企业管,2004,02(1):41-43.

篇2

[关键词]进化 博弈 文献综述

一、进化博弈的基本理论

进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究

1.社会行为领域

Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化

青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。

3.经济行为的演化

Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。

三、借鉴意义

1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。

2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。

参考文献:

[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)

[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998

[3] 青木昌彦 奥野正宽:经济体制的比较制度分析.中国发展出版社,1999

[4]邱中华 金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26

篇3

关键词:企业集团;全面预算管理;不完全信息动态博弈

中图分类号:F2

文献标识码:A

文章编号:1672-3198(2010)04-0163-02

博弈论在企业集团预算编制中的应用不同于单一企业,区别在于它还存在着母公司与成员企业(即全资子公司、控股子公司和参股公司成员企业)之间的博弈,而单一企业只存在公司内部的博弈,因此本文将主要对企业集团预算编制中存在的母公司与成员企业之间的博弈进行分析。

1 博弈模型建立的基本假设

(1)在企业集团的预算编制过程中,博弈的参与人为成员企业(以下代称“申请人”)和集团总部审批部门(以下代称“审批人”)。审批人和申请人都是理性经济人,即他们都追求各自利益的最大化。并且,“理性”是参与人的共同知识,即所有参与人知道所有参与人是理性的。

(2)博弈的参与人对于双方的收益和行为并不完全了解,此时的博弈信息是不完美的。同时,双方的信息是不对称的,申请人因为拥有信息优势而处于人地位,审批人则处于委托人地位。

(3)申请人和审批人的策略选择不是同时的,而是有先后次序的。

(4)申请人和审批人之间的博弈可以看作是一个两阶段动态博弈。

2 博弈模型的战略空间分析

(1)根据上述假设,申请人在上报其成本费用类项目的预算水平时,存在高报和实报两种选择。令T={t1,t2},表示申请人的战略空间;t1表示申请人高报其成本费用类项目的预算水平;t2表示申请人如实上报其成本费用类项目的预算水平;t2

(2)假设申请人隐瞒高报预算水平成功的额外收益为R(R≥0),实报的额外收益为0;高报预算水平的成本为C(R>C≥0),实报时C=0。另外,若申请人高报预算水平的行为被审批人发现,则会招致企业集团母公司的处罚,罚款金额为F,F=nR(n为惩罚系数)。

(3)运用海萨尼转换方法,选择一个虚拟参与人“自然”,用N表示。令M={m1, m2},表示自然的信号空间。m∈M,表示自然发送的申请人想传递出的信号。当m=m1时,表示自然发送出申请人想传递出不刻意隐瞒自己高报成本费用类项目预算水平的行为;当m=m2时,表示自然发送出申请人声称自己的预算水平是据实申报的并且采取一定的方式和手段隐瞒自己的高报行为,从而使高报行为不易被发现。

(4)审批人观察到自然发送的信号mi(i=1,2)并进行一定的审查复核程序之后,选择批准或拒绝。因此,审批人的战略空间为A={a1,a2}。a∈A,表示审批人采取的行动。当a=a1时,表示审批人批准申请人的预算;当a=a2时,表示审批人拒绝申请人的预算。并假设为了确保预算管理的顺利实施以及企业集团整体发展战略的贯彻落实,企业集团母公司会对审批人采取激励措施:如果审查出申请人有高报预算水平的行为,则可从对申请人的罚款F中提取系数为β的奖金,即βF。此外,如果审批人对申请人提交的预算水平采用弱力度的审查行动,则需付出的成本为C1(C1≥0),但几乎审查不出申请人的高报预算水平行为;若采用强力度的审查行动则可发现申请人的高报预算水平行为,但需付出较多的成本C2(C2≥0),显然C2>C1。

(5)当t=t2时,必有m=m2,即当申请人如实申报其预算水平时,他绝不会声称自己高报预算水平。因为申请人作为理性经济人,其行动方案的选择必定遵守自我期望收益最大化的原则。

3 模型的构建和求解

根据以上设定和条件,我们用博弈树图来表示企业集团全面预算管理编制过程的不完全信息动态博弈模型,如下图所示。

图1

用U1、U2分别表示申请人和审批人的效用。根据上图所示可得出各参与人在不同状态下的效用为:

U1(t1,m1,a1)=-C,U2(t1,m1,a1)= -C1

U1(t1,m1,a2)=-C,U2(t1,m1,a2)= -C2

U1(t1,m2,a1)=R-C, U2(t1,m2,a1)= -C1

U1(t1,m2,a2)=-F-C,U2(t1,m2,a2)=βF -C2

U1(t2,m2,a1)=0,U2(t2,m2,a1)= -C1

U1(t2,m2,a2)=0,U2(t2,m2,a2)= -C2

通过对该不完全信息动态博弈模型的分析,我们可以得到以下结论:

(1)当奖励系数β≤C2-C1/qF=C2-C1/qnR时,混同均衡{m*(t),a*(m),P(t|m)}是模型的子博弈精炼贝叶斯纳什均衡。证明如下:

设申请人采用混同策略m(t)=t2,t=t1t2,t=t2,即m*(t)=m2时,审批人相应的信息推断为:P(t1|m1)=1,P(t2|m1)=0,P(t1|m2)=q,P(t2|m2) =1-q,审批人的策略是选择a(m)∈A,最大化其期望收益,故有

maxa=a1 a2Σt=t1 t2 U2(t,m,a)P(t|m)。

当m=m2时,利用β≤ (C2-C1)/qF,有:

maxa=a1. a2Σt=t1 t2 U2(t,m2,a)P(t|m2)=maxa=a1 .a2{qU2(t1,m2,a)+(1-q)U2(t2,m2,a)}=maxa=a1•a2{qU2(t1,m2,a1)+(1-q)U2(t2,m2,a1),qU2(t1,m2,a2)+(1-q)U2(t2,m2,a2)}=max{-C1,qβF-C2}=-C1

可得a (m2)=a1。

当m=m1时,同理可得a (m1)=a1,这样我们可以得出结论:审批人于混同策略的最佳反应是a*(m)a1,即审批人对申请人的预算水平总是采用弱力度的审查行动。

根据审批人对于混同策略总是采取a*(m)a1策略,申请人的策略是选择申报方案最大化其期望收益,故有。maxm=m1.m2U1(t,m,a1)

当t=t1时,有:maxm=m1.m2U1(t1,m1,a1)=maxm=m1.m2{U1(t1,m1,a1),U1(t1,m2,a1)}=max{-C,R-C}=R-C

故得m(t1)=m2。同理,对于t=t2易得m(t2)=m2,因此申请人的最佳反应是混同策略m*(t)m2,那么{m*(t),a*(m),P(t|m)}是模型的子博弈精炼贝叶斯纳什均衡。

(2)当奖励系数β>(C2-C1) /qF= (C2-C1)/qnR时,将导致博弈双方交替使用混同策略与分离策略。证明如下:

设申请人采用混同策略m(t)=t1,t=t1t2,t=t2,则审批人相应的信息推断为:P(t1|m1)= P(t2|m2)=1,P(t1|m2)= P(t2|m1)=0。审批人的策略是选择a(m)∈A,最大化其期望收益,故有 maxa=a1.a2Σt=t1.t2 U2(t,m,a)P(t|m)。

①当m=m1时,利用C2>C1,有:maxa=a1.a2Σt=t1.t2 U2(t,m1,a)P(t|m1)=maxa=a1.a2{U2(t1,m1,a)P(t1|m1)+U2(t2,m1,a)P(t2|m1)}=maxa=a1.a2U2(t1,m1,a)=maxa=a1.a2{(U2(t1,m1,a1),U2(t1,m1,a2)}=max{-C1,-C2}=-C1

故得a(m1)=a1。

②当m=m2时,利用C2>C1,有:maxa=a1.a2Σt=t1.t2 U2(t,m2,a)P(t|m2)=maxa=a1.a2{U2(t1,m2,a)P(t1|m2)+U2(t2,m2,a)P(t2|m2)}=maxa=a1.a2U2(t2,m2,a)=maxa=a1.a2{(U2(t2,m2,a1),U2(t2,m2,a2)}=max{-C1,-C2}=-C1

亦有a(m2)=a1。显然,申请人的分离策略导致了审批人的混同策略a(m)a1。

对于审批人的混同策略a(m)a1,申请人的反应是选择m(t)∈M,最大化其收益,故有:

maxm=m1.m2(t1,m,a1)=maxm=m1.m2{U1(t1,m1,a1),U1(t1,m2,a1)}。

当t=t1时,有:

maxm=m1.m2(t1,m,a1)=maxm=m1.m2{U1(t1,m1,a1),U1(t1,m2,a1)}=max{-C,R-C}=R-C,

故得m(t1)=m2。同理,对于t=t2易得m(t2)=m2,于是审批人的混同策略导致了申请人的混同策略m(t)m2。

对于申请人的混同策略m(t)m2,审批人的相应推断为:P(t1|m1)=P(t2|m2)=1,P(t1|m2)=P(t2|m1)=0。审批人将选取策略a(m),使期望收益最大化。

①当m=m1时,利用C2> C1,有:maxa=a1.a2Σt=t1.t2U2(t,m1,a)P(t|m1)=maxa=a1.a2U2(t1,m1,a)=maxa=a1.a2{U2(t1,m1,a1),U2(t1,m1,a2)=max{-C1,-C2}=-C1

故得a(m1)=a1。

②当m=m2时,利用β> (C2-C1)/qF,有:

maxa=a1.a2U2(t,m2,a)P(t|m2)=maxa=a1.a2{qU2(t1,m2,a)+(1-q)U2(t2,m2,a)}=maxa=a1.a2{qU2(t1.m2.a1)+(1-q)U2(t2,m2,a1),qU2(t1,m2,a2)+(1-q)U2(t2,m2,a2)}=max{-C1,qβF-C2}=qβF-C2

可得a(m2)=a2。于是,申请人的混同策略导致了审批人的分离策略。

对于审批人的分离策略,申请人的反应是选择m(t),最大化收益U1(t,m,a)。

当t=t1时,有:

maxm=m1.m2U1(t1,m,a1)=maxm=m1.m2{U1(t1,m1,a1),U1(t1,m2,a1)=max{-C,R-C}=R-C

故得m(t1)=m2。同理,对于t=t2易得m(t2)=m2,于是审批人的分离策略导致了申请人的分离策略,进而导致了审批人的混同策略。

4 建立和完善全面预算管理制度的相关建议

预算编制是全面预算管理的起点和核心,全面预算管理工作实质是人的行为过程,是不同利益相关者之间博弈的过程。根据以上对企业集团预算编制过程的不完全信息动态博弈分析结论,提出以下几点建立和完善全面预算管理制度的相关建议:

(1)由于制度上的“漏洞”产生了预算博弈的机会和激励,因此,完善企业集团的各项制度,从制度上消灭预算博弈产生的土壤,是治理预算博弈的一项重要措施。高报预算的额外收益(R)减少,无疑将使成员企业的预期净收益减少,弱化其选择高报预算的动机,从而使企业集团预算管理中的预算博弈行为得到减少。

(2)着力改变企业集团总部审批部门的信息不对称状态,构建内容全面、反映及时的财务管理信息体系,提高成员企业高报预算水平行为的风险系数。一方面,企业集团应提高成员企业信息披露的充分性、透明性,规范财务信息披露行为;向成员企业派驻预算专员,且派驻人员的薪酬待遇由企业集团母公司统一支付与管理;另一方面,应加大对成员企业高报预算水平行为的惩罚系数以减少其收益,成员企业将充分地考虑自己付出的努力能不能得到回报――获得巨大的超额利润,三思而后行,最后的结果可能是放弃预算博弈活动。

篇4

关键词:农产品;价格;预警;灾变灰

中图分类号:F323.7 文献标识码:A DOI 编码:10.3969/j.issn.1006-6500.2015.04.012

Forecasting for Changes of Farm Produce Price Based on Calamities Grey Prediction and its Application

SONG Jing

(Department of Finance and Economics, College of Xinyang Agriculture and Forest, Xinyang, Henan 464000, China)

Abstract: As farmers and the consumers would suffer much unexpected loss due to the farm produce price exceptional fluctuations, so forecasting and then addressing them correctly becomes increasingly important today. In order to predict this price fluctuation effectively, a risk forecast model for exceptional changes of farm produce price is proposed based on grey prediction theory, and the effectiveness of the model is tested by a case subsequently. The result provides satisfying support for the validity of the model.

Key words: farm produce;price;risk forecast;calamities grey

在市场经济条件下,随着市场供求关系的变化,农产品价格围绕价值曲线上下波动是一种正常现象。对农户而言,一方面需要采取各种措施来应对价格波动,以达到抵御风险和降低损失的目的,另一方面,采用科学的方法对价格变动趋势进行有效地监控和预测,为农户提供精确的预测数据对农业生产而言至关重要。由于国家宏观调控政策的实施,加之农户自己在市场信息搜集方面的投入和努力,农产品价格会保持相对稳定。然而,以往研究表明农产品价格的起落常常是由多种外部因素交互作用所导致的[1-3],正因如此,在某些年份农产品价格波动可能会出现异常现象,会比其他年份明显偏低或偏高,不仅给农户带来重大经济损失,而且会对广大消费者的生活带来极大的不便和麻烦,并进而对社会稳定造成隐患。例如,2007年的猪肉价格异常偏高就在群众中造成了一定程度的恐慌。因此,能否对农产品价格的这种异常波动进行有效预警就显得尤为重要。

就农业生产而言,由于农产品价格与投入品价格呈正向相关关系,因此,进行简单的价格水平预测并没有多少实际意义,关键在于能否根据现有价格的异常波动年份来预测下一个可能的异常波动年份。也就是说,对这些异常价格波动年份进行预测要比单纯的“价格”预警更有实际价值。就现有的预测工具而言,传统的加权移动平均模型、趋势移动平均模型、简单移动平均模型、回归模型等都需要充足的历史数据[4],而现实中的农产品价格相关的统计数据通常很少,其中异常数据更是凤毛麟角,因此,采用传统的预测模型无法精确预测现实中的农产品价格异常波动问题。与传统预测方法不同,灰预测的特色在于既可以对序列作值分布灰预测,又可以作时分布灰预测,而且对序列的数据量要求不高,只要大于或等于4即可,因此非常适合于农产品的价格异常波动预测。基于此,笔者构建了一个基于灾变灰预测理论的农产品价格异常波动预警模型,并以福建省生猪收购价格的波动预测为例检验了该模型的有效性。

1 理论与模型

1.1 理论原理

灰色系统理论是针对既无经验、数据又少的不确定性问题,即“少数据不确定性”问题提出的,其核心理念强调信息优化,研究现实规律[5]。灰预测理论是灰色系统理论的一个重要子理论,目前该理论已广泛应用于社会生产的各个领域。实践中,在进行各种类型的预测时,为了获得准确的预测结果,需要用于预测的客观数据具有全信息性。根据灰色系统理论,具有灰因(原因)白果(结果)律的数据满足全信息性。在进行农产品价格预测时,作为预测的基本数据,农产品价格波动是当年各种因子如成本、疫病、流通、信息不对称、规模化程度、宏观经济形势……等共同作用的结果。也就是说农产品价格波动因子满足灰信息覆盖的特点。而每年(月、季)的农产品价格是确定的,满足白信息覆盖的特点,也就是说,从价格影响因素到后续的价格波动之间的关系符合灰因白果的特点,用农产品价格数据建立灰预测模型,符合灰色系统理论要求的全信息性。据此笔者认为,可以利用灰预测方法来有效预测农产品价格的异常波动。

1.2 模型建立

在灰预测理论中,灾变灰预测是被广为采用来进行各种突发事件预警和预测的一种预测方法。灾变灰预测又称异常值灰预测,是对异常值的“时”分布进行建模以预测跳变点未来“时”分布的一种灰预测方法。根据该理论,如果时间序列中含有异常值,可以采用GM(1,1) 模型预测异常值的时间分布。例如,由于受多因素影响,农产品价格在某些年份会出现异常波动,导致价格序列中会出现一些异常值。因此,利用农产品价格的这些异常值来预测下一次价格异常波动的具体年份,可以帮助农户对这种价格异常波动做好充分的准备。具体建模步骤如下。

(1)令x为含异常值的原始序列。

■,为历年价格数据。

假设ζ为正实数,如果

1° ■为异常值,则称ζ为上灾变阀值;

2° ■为异常值,则称ζ为下灾变阀值。

在本模型中,对■和■两种情况不加区分,即将价格异常高和异常低两种情况合并起来研究。

(2)记x中异常值为x(kζ)。

记x(kζ)的序列为kζ

则kζ为灾变序列,其数值称为灾变值分布序列。

称灾变序列kζ中分布点kζ的序列tζ为灾变时分布序列。

(3)令tζ为异常值时分布。

■,记■

序列:■

(4)GM(1,1)建模。

GM(1,1)的含义为1阶(Order),1个变量(Variable)的灰(Grey)模型(Model)。

若序列■满足: σ(0)(k)∈(0.135 3,7.389)。其中:

■,σ(0)(k)称为级比。

则可对序列x(0)作GM(1,1)建模:

■(1)

■(2)

■(3)

■(4)

式(1)为GM(1,1)的定义型,式(2)为GM(1,1)的白化模型,式(3)和式(4)为GM(1,1)的白化响应式,即预测公式。其中:

■(5)

■(6)

■(7)

式(7)中x(1)(k)=■x(0)(m),即x(1)是x(0)的累加生成序列。

(5)残差检验。

残差检验的目的在于检验模型的预测精度。令x(0)(k)为实际值,x(0)(k)为预测值,则

1°称e(0)(k)为相对残差。

2°称e(0)(avg)为平均残差。

3°称p°为精度。

2 应用举例

福建省1999―2012年的生猪收购价格如表1所示。笔者利用该数据建立模型来对该省生猪收购价格的异常波动情况进行预测,并根据预测结果来检验模型的有效性。具体方法如下。

(1)原始序列为

x=(x(1),x(2),…,x(14))=(4.32,4.72,…,16.47)。

(2)确定灾变序列。

由于价格具有随时间而上升的趋势,因此价格的灾变(即异常)不能以价格的绝对值来衡量,而应当以相邻两年的变化幅度来界定。假设相邻两年的价格变动超过10%为价格异常波动,则有灾变阀值ζ=10%,即若:

■,则第k年为灾变年份。由此可得灾变序列为:

■=

(5.44,8.04,9.44,9.36,14.68,18.32,16.47)

(3)灾变时分布序列为

■。

即在第3,4,5,9,10,11,14年,也就是2001、2002、2003、2007、2008、2009、2012年生猪收购价格出现了7次异常波动现象。利用其前6次价格异常波动数据建模,然后利用该模型预测第7次出现价格异常波动的年份,并将预测结果与实际年份相对照,以检验该模型的有效性。

(4)级比平滑性检验。

σ(k)∈(0.135 3,7.389)

表明序列x(0)是平滑的,可作GM(1,1)建模。

(5)建立模型。

由式(5),(6),(7)可得:

代入式(3)、(4)得

■(8)

■(9)

(6)预测。

将k=6代入式(9)得:

■(对于预警而言通常宜早不宜晚)

这表明在第14年(即2012年)将会再次出现价格异常波动现象,预测结果与实际情况是一致的,表明本模型有很高的应用价值。

(7)模型预测精度检验。

为了检验模型的预测效果,作以下残差检验:

残差检验结果表明,本模型的预测精度达到89.9%,这对于受多因素影响而变化极不规则的农产品价格波动而言已经达到了比较理想的预测效果。

3 结 论

笔者以灰预测理论为基本的理论框架构建了一个农产品价格异常波动预警模型,并以福建省生猪价格的异常波动预测为实例介绍了利用该模型对农产品价格异常波动进行预警的做法[6-10]。结果表明:(1)灾变灰预测方法是对农产品价格异常波动进行预警的一种有效方法,解决了传统预测方法无法解决的问题;(2)可以利用残差检验对模型的预测精度进行检查,从而可以对预测的精确性有一个基本的判断。本方法也不可避免地存在一些局限性:当农产品价格异常波动年份数据序列的级比平滑性不能满足时,也就是说,当级比小于0.135 3时,将无法利用GM(1,1)模型来对价格异常波动进行预测,就本研究的生猪价格而言,就是某相邻的两次价格异常波动年份距离较远,不过就现实情况而言,这种特殊情况出现的概率通常很小[6-10]。

参考文献:

[1] 王吉恒,王新利. 农产品市场风险与市场预测研究[J].农业技术经济, 2003(3):1-5.

[2] 姜长云,刘志荣. 高度警惕主要农产品价格出现大起大落的风险[J]. 中国发展观察,2008(2):8-11.

[3] 董少杰.政府部门对农产品市场风险预警的管制和调控――基于猪肉和大蒜价格暴涨经济学分析[J].天津农业科学,2012(4):95-99.

[4] 刘武,娄成武. 定量分析方法[M]. 北京: 科学出版社,2003.

[5] 邓聚龙. 灰理论基础[M]. 武汉: 华中科技大学出版社, 2002.

[6] 侯杰泰,温忠麟,成子娟.结构方程模型及其应用[M].北京:教育科学出版社,2004.

[7] 钟昱,张鹏.农产品价格研究方法综述[J].市场经济与价格,2012(9):11-13.

[8] 李干琼.SV因子框架分析下农产品市场短期预测[D]. 北京:中国农业科学院,2012.

篇5

关键词:激励 企业管理 满意感

1 波特—劳勒“综合激励模型”概念

美国行为科学家波特(l.w.porter)和劳勒(e.e.lawler)在1968年的《管理态度和成绩》一书中提出了综合型激励模型。

波特—劳勒的“综合激励模型”勾勒出努力工作与取得绩效、获取奖酬、满足个体需要之间的内在联系。其逻辑关系是:人们的努力工作导致取得良好绩效,取得绩效后得到相应报酬,最终满足需要而产生满意感。

“综合激励模型”在特定情况被称之为努力工作程度的外因刺激模型。努力程度是指:行为者受到激励的强度和由此产生的对工作投入的力度程度。努力程度主要取决于效价和期望值两个关键因素。效价是指:个体预计取得绩效后所带来的效用价值(重要性),即主体感受到的意义。期望值是指:对达成绩效的概率估计(可能性)。只有当人们对某一行动的绩效的效价和期望值同时处于一定水平时,才能促使个体产生强大的内在自我驱动力,并付诸行动,努力指向行为的目标。工作绩效是指:工作表现和所取得的成果。它是个多维变量的结果,不同文化程度和不同意识形态有一定程度的差异,除了受个人努力程度这一主要因素的影响之外,还要受到其他多方面因素的制约。主要有:个人能力与素质、工作条件与工作环境、外界环境与条件、角色感知等。个人能力与素质是指:个体从事相关工作的必要的智能、技巧以及生理、心理、环境条件发射等方面的相关品质素质,这是完成工作任务、取得工作绩效的自身已经具备的条件。工作条件是指:适合于从事该项工作的外在条件,体现在物理环境、人际环境、社会环境、保障措施等方面。认识程度即角色感知是指:个体对自身行为与组织期望关系的理解。这三者将对能否取得预期绩效产生重要作用,以及后期变化趋势与发展,同时也会在一定程度上影响对期望值的判断。奖酬是指:个人取得工作绩效后的各种所得报酬。它由外在奖酬与内在奖酬两部分组成。前者指工作目标达成之后,组织给予的物质报酬和表扬鼓励等,是外加性的报偿。后者是在工作过程中或获得绩效时的体验、心理感受,如工作本身的乐趣、成就感、胜任感等,是内在性的报偿,这其中,周边人际关系环境也对无形奖酬起到重要作用。满意感是指:个人当取得某项预期结果时所体验到的满意感觉程度。满意是个人内在的主观心理感受,他不仅决定于实际获得的有形奖酬,还决定于个人对一定水平工作绩效所预期的奖酬影响,即受“期望的公平”影响。认为付出与所得相当,经与纵向、横向的比较,认为合理,就会感到满意。满意感会影响下一轮行为的努力程度,但满意感是随时间、空间和时态变化而变化的变量因素。

2 波特—劳勒“综合激励模型”的具体应用

2.1 打破原有框框,建立新的有效激励机制 捻丝车间是国有改制企业鑫荻良公司下属的一个生产加工车间,有两条从德国引进的生产线,设计生产能力1200吨/年,有管理人员和生产一线工人20多人,2000年正式建成。原先生产加工效益较好,但2005年以后,随着国内同类型设备的增加,竞争加剧,定单数量逐年下降,生产负荷一直维持在50%左右,基本处于亏损状态,员工收入减少,士气低落。

2008年,公司经营者从波特—劳勒“综合激励模型”中得到启发,转变思路,大胆提出打破原有框框,建立新的考核激励机制。公司经营者向车间员工提出了新的考核目标,鼓励员工做出绩效,提高收入,激发员工的积极性。公司取消了原来一些单个的传统的考核项目,诸如产量、质量、单耗、运行天数、检修费用等,取而代之的是对车间进行模拟利润考核,即车间每月取得的模拟利润,公司以一定比例奖励给车间。每月由公司财务部会同生产部、营销部等部门,对车间进行独立的全成本核算,真实、客观地反映每月车间的经营成果。经营业绩直接与员工收入挂钩,奖励部分由车间自己支配,并通过制度予以保证,使车间员工的付出和回报成比例,使公司的效益增加的同时,员工的收入也同步增长,充分体现“多劳多得”。同时,公司对车间充分放权,车间有人员的调配权、安排生产计划权、采购原料和产品定价否决权等,车间从不关注市场和不关心市场规则到积极关注市场,参与市场和主动参加市场竞争,产品更对路,成本更真实,效益更实在。

2.2 进行能力和环境分析,确定合适的效价和期望值 在不同的岗位中,员工的能力对完成本岗位的任务起着巨大的作用。公司在征求车间主任意见的基础上,对车间人员进行了适当的调整,做到人尽其才。配备好人员后,还为其发挥才干创造了必要条件,配备必要的资源,给与释放和展示才干的空间。

影响员工努力程度的两大因素是效价和期望值。根据期望理论,员工对一个事件投入程度跟目标效价和期望值有关,如果目标达成获得的激励对员工没有吸引力,那么员工工作积极性就会受影响,如果目标达成对员工来说不切合实际,员工没有信心达成目标,那么这样的激励对员工就犹如“水中月、镜中花”,员工也不会为不可能完成的事情而竭尽全力。

所以,在制定考核指标时,充分考虑车间的实际情况,经过对前几年的数据汇总分析,制定出公司和车间都能接受的适合的利润目标。奖励的力度不再是“不疼不痒”,而是很有吸引力。弗鲁姆期望理论的激励公式是:激励力量=效价x期望值。该公式表明激励力量与效价、期望值成正比。效价再高,如期望值太低,激励力量是有限的,反之亦然。期望过高,可能会失望,导致挫折感;期望过低,不能开发潜力,难以获取最佳业绩。

2.3 转变员工的身份,提高员工的认识程度 在波特—劳勒“综合激励模型”中,把“角色感知”作为达成“工作绩效”的重要因素之一,通过回馈,进而对“努力程度”也产生影响。“角色概念”就是一个人对自己扮演的角色认识是否明确,是否将自己的努力指向正确的方向,抓住自己的主要职责或任务,明确自己在整体环境中应该主动和积极去完成的任务。

公司改制后,企业由国有企业变成了民营企业,员工的身份也随之转变成了公司的股东和员工双重身份,既是公司的主人,是“小老板”,又是公司的雇员,是“打工者”。但员工的思想转变需要一个过程,需要正面引导。员工对企业的主人翁认识程度不够,还是停留在原来国企中的思维,还没有真正转变过来。公司为此对员工进行了宣传、沟通和教育,使大家统一和提高了认识。

作为公司的雇员时,工作上的主观能动性就不能充分被调动,往往工作被动和消极,而作为主人,就会觉得自己是公司的一份子,会产生比较强的责任感,把做好工作看作为自己的一份责任,而且会发自内心,也比较容易接受来自于公司的目标要求,并产生认同感,为考核取得实效打下扎实的基础。

2.4 确保公平、公正的评价,提高员工的满意感 奖惩措施是否会产生满意感,取决于被激励者认为获得的报偿是否公正。如果他认为符合公平原则,当然会感到满意,否则就会感到不满,而满意将导致进一步的努力。波特—劳勒“综合激励模型”中,感觉公平是组织奖励带来员工满意的前提。

公平理论认为,一个人对工作报酬的满意度,不仅仅受绝对值的影响,更受相对值的影响。员工对自己所付出的劳动及所得到的报酬,要进行纵向和横向的比较,将自己以前的劳动投入与所得报酬和现在的劳动投入与所得报酬进行纵向比较,还将自己的劳动投入与所得报酬和他人的劳动投人与所得报酬进行横向比较。比较的结果是相等的,就认为公平合理;如果是不相等,同样的投入,报酬少于以前,或少于他人,就会认为是不公平、不合理,就会导致心理失衡,产生不满意感,影响积极行为。

所以,公司建立了公平、公正的考核体系,有专门的考评小组严格把关,在每月公司经济活动分析会上讲评,既充分肯定成绩,也决不掩盖问题。使车间员工能真正拿到付出后的回报,其它部门也心服口服,避免了部门之间的矛盾发生。

2.5 实现激励有效性,推进综合激励循环 综合激励模型认为,员工努力会促进工作绩效的提升,工作绩效提升会得到组织奖励,组织奖励会使员工满意,员工感到满意后会继续努力工作,这样就完成了一个绩效管理综合激励循环,形成一个闭环系统。

经过实践,首先,车间员工的精神面貌发生了很大改变,大家表现出良好的主人翁态度。车间上下积极动员起来,日班人员往往一人兼几职,日班的电工、检修工、铲车工积极参与割筒管、修台车、打包、装车等工作,分工不分家,同甘共苦;生产一线的员工表示,工作量尽管增加,人员不增加,但要提高劳动产生率,降低人工成本;对原来一些更换下来的备品件修旧利废,降低备件费用,对回收的纸管自己进行再加工,节约辅料费用。车间在原来仅仅生产涤纶丝的基础上,积极尝试生产其它品种,并取得成功,如锦纶、氨纶等。在原来只能生产1000旦~3000旦的规格的基础上,自己动手进行技术改造,现在已能生产45旦~5000旦的产品。还积极开拓来料加工业务,客户不分大小,服务不大折。在稳定质量、降低单耗方面也有不少新的举措。车间提出的口号是:“不能由于质量问题而逃走一个客户,”“我们比价格,更比服务。”

3 运用波特—劳勒“综合激励模型”企业经营者应注意的几个问题

3.1 考核激励是循序渐进的过程,激励能否形成良性循环,取决于多种综合因素 通过实践可以认识到,不要以为设置了激励目标、采取了激励手段,就一定能获得所需的行动和努力,并使员工满意。要形成激励努力绩效奖励满足并从满足回馈努力这样的良性循环,还取决于奖励内容、奖惩制度、组织分工、目标导向行动的设置、管理水平、考核的公正性、领导作风及个人心理期望值等多种综合性因素。

3.2 在设置考核激励内容时,应该考虑到固定收入和浮动收入的比例 在固定收入满足员工生活基本需要前提下,应加大绩效工资、奖金等激励薪酬的含量与比重;另一方面在重视物质激励作用的同时,不能忽视精神激励的重要作用。不能把奖金的比例放得太大,超过50%就显得不合理。

3.3 在激励方式上,应该注意激励的及时性、针对性 考核一定要考虑到部门或车间的实际情况,要可操作和可控制,绝对不能发生失控的情况;考核指标要有相对稳定性,不能经常改变,在经过一个稳定周期后,可以作适当的修正;考核要考虑到公司其它部门之间的公平性,以对公司的贡献大小为主要依据,有所偏颇会产生矛盾;对部门或车间的激励,同时还要考虑到公司职能部门的贡献。

篇6

关键词:隐蔽通信;隐写系统;主动攻击;博弈论;嵌入率;误码率

中图分类号: TP309.2

文献标志码:A

Abstract:

To solve the problem of active attack on steganographic system, the counterwork relationship was modeled between steganographier and active attacker. The steganographic game with embedding rate and error rate as the payoff function was proposed. With the basic theory of twoperson finite zerosum game, the equilibrium between steganographier and active attacker was analyzed and the method to obtain their strategies in equilibrium was given. Then an example case was solved to demonstrate the ideas presented in the model. This model not only provides the theoretic basis for steganographier and active attacker to determine their optimal strategies, but also brings some guidance for designing steganographic algorithms robust to active attack.

Key words: covert communication; steganographic system; active attack; game theory; embedding rate; Bit Error Rate (BER)

0引言

隐写是信息隐藏领域除数字水印外的另一大分支,目的是将秘密消息嵌入多媒体数据(如数字图像、音频、视频或文本)中实现隐蔽通信。对隐写的攻击主要有被动攻击和主动攻击,被动攻击又称隐写检测,其目的是从公开传输的多媒体数据中检测出秘密信息,而主动攻击的目的则是破坏存在于多媒体数据中的秘密信息。

目前隐写领域的研究主要集中在具体的算法方面,关于隐写理论模型方面的研究进展较为缓慢。有学者从隐写方和攻击方的对抗关系入手,借用博弈论来研究隐写理论模型。刘春庆等[1]以隐写和隐写检测算法作为隐写方和攻击方的策略,以二人零和博弈建立了隐写对抗模型;刘光杰等[2]以期望安全数据传输率作为收益函数,建模了隐写方和攻击方之间的对抗;蒋翠玲等[3]将隐写方和攻击方的互信息作为收益函数,分析了博弈双方在不同失真约束下的隐写容量;Schttle等[4]和Johnson等[5]利用博弈理论研究了内容自适应隐写方法的安全性。以上研究都是利用博弈论建模隐写方和被动攻击方之间的对抗关系。在公开信道中存在各种有意或无意的主动攻击,如噪声、内容篡改等,这些攻击的存在严重影响秘密信息的可靠传输,这对于以通信为目的的隐写是难以忍受的。Ettinger等[6]利用博弈论研究了隐写方和主动攻击方之间的对抗,他们以隐写方能正确传送的消息比特作为收益函数,分析了空域隐写对抗双方的博弈均衡,但他们却忽略了对隐写的安全性约束。本文从隐写系统应用角度出发,在对隐写方和主动攻击方进行约束的基础上,以信息嵌入率和错误率两个目标为收益函数,研究隐写方拥有多种隐写算法,主动攻击方拥有多种主动攻击方法时双方的博弈模型。

1隐写系统通信模型

隐写系统的通信模型如图1所示。

5结语

本文将隐写通信系统中的隐写方和主动攻击方作为博弈双方,在对博弈双方进行失真约束基础上,以信息嵌入率和错误率两个目标作为收益函数,建立了主动攻击下的隐写系统博弈模型。借助二人有限零和博弈基本理论,本文分析了博弈均衡的存在性,并给出了均衡局势下隐写方和攻击方的最优混合策略求解方法。最后给出一个简单实例对文中的博弈模型进行了说明和验证。本文提出的模型不仅可为隐写方选择最优隐写算法和容错方法提供决策依据,也可指导隐写算法设计者选择最优容错方法。需要注意的是,给定策略集时,安全性限制和隐秘载体失真限制的取值直接决定了信息嵌入率和错误率。为了获得满意的信息嵌入率和错误率,如何设定安全性限制和隐秘载体失真限制将是下一步研究的重点。

参考文献:

[1]LIU C, LI Z, WANG Z. A gametheoretic model to covert communication systems [J]. Journal on Communications, 2004, 25(5): 160-165.(刘春庆,李忠新,王执铨.隐秘通信系统的对策论模型[J].通信学报,2004,25(5):160-165.)

[2]LIU G, DAI Y, ZHAO Y, et al. Modeling steganographic counterwork by game theory [J]. Journal of Nanjing University of Science and Technology: Natural Science, 2008, 32(2): 199-204.(刘光杰,戴跃伟,赵玉鑫,等.隐写对抗的博弈论建模[J].南京理工大学学报:自然科学版,2008,32(2):199-204.)

[3]JIANG C, PANG Y, LIN J. The steganography capacity game analysis based on the digital images [J]. Microelectronics and Computer, 2010, 27(1): 22-24.(蒋翠玲,庞毅林,林家骏.数字图像隐写容量的博弈分析[J].微电子学与计算机,2010,27(1):22-24.)

[4]SCHTTLE P, BHME R. A gametheoretic approach to contentadaptive steganography [C]// Proceedings of the 14th International Conference on Information Hiding. Berlin: Springer, 2012: 125-141.

[5]JOHNSON B, SCHTTLE P, BHME R. Where to hide the bits? [C]// Proceedings of the Third International Conference Decision and Game Theory for Security. Berlin: Springer, 2012: 1-17.

[6]ETTINGER J. Steganalysis and game equilibria [C]// Proceedings of the Second International Workshop on Information Hiding, LNCS 1525. Berlin: Springer, 1998: 319-328.

[7]LIU D, HUANG Z. Game theory and its application [M]. Changsha: National University of Defence Technology Press, 1996: 23-60.(刘德铭,黄振高.对策论及其应用[M].长沙:国防科技大学出版社,1996:23-60.)

[8]COX I J, MILLER M L, BLOOM J A, et al. Digital watermarking and stegangoraphy [M]. Waltham, MA: Morgan Kaufmann Publishers, 2008: 117-123.

[9]MIELIKAINEN J. LSB matching revisited [J]. IEEE Signal Processing Letters, 2006, 13(5): 285-287.

[10]CRANDALL R. Some notes on steganography [EB/OL]. [20130712]. http://os.inf.tudresden.de/~westfeld/Crandall.pdf.

篇7

摘 要:构建由单一制造商、批发商和零售商组成的供应链合作博弈模型,分析三个参与者之间可能组成的联盟形式,分别讨论不同主导模式下供应链参与者的最优利润。给出数值算例,运用核仁法对供应链利润进行分配,并借助Matlab软件计算核仁法中的复杂线性规划问题。最后比较分析不同主导模式下利润分配的核仁解。

关键词:主导模式;合作博弈;利润分配;核仁

1.引言

供应链中各参与者通过合作所获得的利润大于各参与者通过单独行动所获得的利润之和。目前,国内外多数学者运用契约、核心法和Shapley值等方法对供应链利润分配问题进行了研究,如文献[1-3]。而应用核仁法进行供应链利润分配的却鲜有研究,且多数研究是将制造商作为主导力量。本文延伸了传统的制造商主导研究视角,分析了制造商主导、批发商主导和零售商主导三种不同模式下可能存在的联盟形式的最优利润;并借助Matlab软件求解核仁法中的线性规划问题,最终给出了三种不同模式下利润分配的核仁解结果。

2.模型假设

考虑由单一制造商、批发商和零售商组成的供应链合作博弈问题,参与者以利润最大化为目标。文中符号的下标M、W、R分别表示制造商、批发商和零售商。制造商以单位生产成本cm制造产品后,以价格pm向批发商销售;批发商再以价格pw向零售商销售,其边际运营成本为cw;最后零售商以价格pr向消费者销售,cr为零售商的边际运营成本。批发商和零售商的价格增量分别为:Δw=pw-pm,Δr=pr-pw。

制造商、批发商和零售商的销售量为qm、qw、qr,qm=qw=qr,且 qr=a-bpr。

3.模型求解

3.1 制造商主导模式

在制造商主导模式下,制造商起领导作用,决策顺序为:①制造商确定pm;②批发商确定pw;③零售商确定pr。依据第2节中的假设,可以得到如下所示的Stackelberg主从对策模型:

(12)

按照此方法迭代,直到存在唯一解时停止,则该唯一解即为利润分配的核仁解。

5.结束语

本文借助Matlab软件分别求解出制造商主导、批发商主导和零售商主导三种不同模式下的利润分配核仁解。通过研究发现:在供应链中的地位越高,参与者所分得的利润越高。在未来的研究中,闭环供应链以及双渠道供应链等更为复杂的利润分配模型的核仁解值得更深入的研究。(作者单位:西安财经学院管理学院)

参考文献:

[1] Karl Inderfurth・Josephine Clemens.Supply chain coordination by risk sharing contracts under random production yield and deterministic demand [J].OR Spectrum.2014,36:525-556.

篇8

【关键词】合作博弈行为策略股票博弈

一、博弈论相关理论

(一)博弈论

博弈论又称对策论。是这样一种理论:旨在冲突对抗的条件下,使用规范的数学理论和方法求解一个问题的最优策略。以上个世纪九十年代为起始点,博弈论一直作为一种创新性的经济剖析方法,涵盖了包括信息经济学在内的高等学科理论。二战期间,在军事领域方面,博弈论也最早发挥了用武之地。博弈论在诸多领域里的应用中,最成功的要属经济学。

(二)非合作博弈

非合作博弈研究的是,在非合作形式下,所有人的行动都被看成是个人行为,即一个人在总的策略环境下自主决策,主要强调个人自主性,也就是我们所理解的“博弈”一词的字面意思。博弈本身表达了一种较量,一种冲突,所以在很多情况下被误认为只包含了冲突因素,而实际上也包含了非合作元素,即冲突和合作是共存的。另外,根据参与博弈的人员之间是否完全了解彼此的信息,以及博弈进行的先后顺序,可以将其划分为四种类型:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈,以及不完全信息动态博弈。

1.完全信息静态博弈。

完全信息静态博弈,与其他三种类型相比,结构是最简单的,即便如此,它也同样涉及了很多非合作博弈中提到的概念。著名的“囚徒困境”博弈桥好能说明这类博弈的特征。

2.完全信息动态博弈。

完全信息动态博弈,指参与博弈的双方都能够完全掌握其他局中人选择的支付函数,且这种函数是在特定的战略组合模式下形成的。这种博弈中的后来者可以观察到前面参与者的行动,进而对其所有信息都有所了解。并且这种类型的博弈一般也都会持续一个较长时期。

3.不完全信息静态博弈。

不完全信息静态博弈,指的是至少有一个局中人对其他局中人的特征是不完全了解的,但却知道其他人所属类型出现的概率。虽然每个局中人不能完全掌握其他人的下一步行动和选择,但却是有路可循的,至少可以根据对方的类型预测到对方大体上会选择什么行动。由此可知,在这种博弈形式下,局中人的最终目的还是根据对自己和他人类型的概率分布进行分析预测之后,使自己的利益最大化。

4.不完全信息动态博弈。

这种博弈类型与精炼贝叶斯均衡相适应。在该博弈类型下,局中人可以根据自己所观察到的信息来推断其他参与者的类型,原因在于局中人之间互相并不清楚对方的类型。

(三)合作博弈

合作博弈包括两种情况:一是博弈双方的利益都有所增长;二是双方中一方的利益增长,另一方的利益不受损害。这两种情况都会使整个社会的利益有所增长。合作博弈研究的是收益分配问题。该博弈下采取的方式主要是合作,也可以说是一种妥协。博弈各方想要达成一致顺利合作,必须经过一个讨价还价进行妥协的过程。即合作剩余的分配,既是达成一致的前提条件,也是妥协后的结果。

二、关于股票市场的博弈特点

如今,博弈论对金融经济领域的影响越来越大。对期货期权市场、证券市场以及保险市场的审视也越多地以博弈论的研究范式为标准。博弈论这一研究方法在股票市场上的运用尚不多见,其中部分原因是由于股票市场构成了一个过于庞大的博弈,人数过多使得博弈论的应用受限。但是,股票市场所进行的的确是一场博弈,博弈论中不少的概念和理论都可以在这里得到应用。

(一)对股票市场的分析

现今,从市场有效理论来说,我国股市属于弱市场。而且“政策市”特征也越来越明显。在很大程度上,政策性因素阻碍了股市本身的正常运作,从发展的角度看,也会损害博弈双方参与者的利益。但是,分别从两者各自的利益角度而言,这种政策性操作确实已经成为当前国家和投资者赖以生存的支柱。因此,政策性因素既是我国股市正常运转的条件,也是我国股市处于制度变迁过程中的一个明显特征。

(二)对股票市场的博弈类型分析

根据博弈中参与者的数量多少,可将博弈分为双方博弈和多方博弈。多方博弈即包含两个以上的参与者的博弈,也更为复杂,而股票市场显然属于多方博弈。实际上,股票市场上存在的博弈到底是哪种类型,总结来说有两种不同看法:一种是把股票市场看作是饱和状态,自己的所得(所失)就是别人的所失(所得),即股票市场是一个零和博弈的市场;另一种观点是把股票市场看作是非饱和状态,自己的所得(所失)不等价于别人的所失(所得),即股票市场是一个非零和博弈的市场,这种观点的依据是股市的总价值总是处于不断的变化之中。相应地,也就有两种不同的方法来计算股市博弈的收益。第一种算法仅以钱作为计算标尺,而股票作为一种筹码,没有内在价值。那么股市就类似于一场没有休止符的赌局,原因在于筹码不能兑换。第二种算法下,计算收益时把股票的内在价值考虑在内。这种观点实际上是把股市看作是一个社会资源再分配的场所。若按第一种算法计算,人们会倾向于持币;若按第二种算法,人们会更倾向于持股,因为股票可以升值,而货币却是逐渐贬值的。

三、关于股票市场的博弈策略分析

(一)将对手分化,衍生出独立子博弈

有些博弈即使有多方参与,实际上也是可以分解为很多个由少数人参与的子博弈,并且各个子博弈间是相互独立的。这样参与整体博弈的过程就可以转变为参与一个个独立的子博弈。那么如果市场中的强者能找到一个只有少数人参与的子博弈,则对这个子博弈的解析也就变得相对简单化。即便参与者还是很多,至少也可以大大降低了这个子博弈的复杂性。也可以说是形成了一种分而治之的策略。

(二)联合其他参与者建立共同联盟

在股票市场上,如果有的参与者处于相对弱势的地位,那么这些人必然不愿意单独与强者对抗,也就很自然会想到与其他参与者联合起来共同对抗。所以,这种策略对应的是弱者积极促成对自己有利的联盟形式。但值得一提的是,这种形式的联盟是不由人的主观意志为转移的,每个参与者都是以自身的利益最大化为原则,来决定加入或者不加入某一联盟。由此可知,如果每个参与者都只考虑个人得失,那么联盟本身也就起不到明显的共同对抗的效果。即在这种策略下,组织对己有利的联盟时,不能只考虑个人利益,而应该联系实际(如对手或者同盟的力量强弱),尽量促成对己有利的联盟。

(三)中立策略和跟随策略

有时市场的投资者可以采取保持中立或者跟随的策略参与到多方博弈中来。但保持中立也是有前提的,一方面,既然决定保持中立就必须满足于较少的利益,如果追求利益最大化,就没办法保持中立。因为一场博弈中,自己的所得来自于其他参与者的所失,故而保持中立只能从博弈中获得较少的收益。另一方面,中立只存在于竞争不太激烈的博弈中否则竞争过于激烈,参与者的对抗就会大规模卷入,这种形势下保持中立就很困难。所以,中立者只能在对抗不那么激烈的博弈中才有立足之地。

参考文献

[1]王建华.对策论.北京.清华大学出版社.1986.

[2]刘德铭,黄振高.对策论及其应用.长沙.国防科技大学出版社.1995.

[3]约翰•纳什著.张良桥等译.纳什博弈论文集.北京.首都经济贸易大学出版社.2000.

[4]莱因哈德•泽尔腾著.黄涛译.策略理性模型.北京.首都经济贸易大学出版社.2000.

篇9

文献标志码:A

文章编号:1002-0845(2012)03-0088-03

收稿日期:2012-01-12

基金项目:2011年新世纪广西高等教育教改工程项目(2011JGA050);桂林理工大学教改项目(2010B06)

作者简介:罗鲲(1966-),男,沈阳人,教授,博士,从事材料学研究;张兴旺(1982-),男,湖北黄梅人,馆员,硕士研究生,从事数据库应用与技术研究;吕竹筠(1965-),女,沈阳人,助理馆员,从事科技文献检索研究。 一、引言 博弈论[1]从诞生至今不过短短半个世纪的时间,但是却已经在经济学、数学、管理学、运筹学、工程学及军事国防等领域产生了重大的影响。从1994年至今,已经有五届诺贝尔经济学奖颁发给了从事博弈论及其应用研究的学者[2]。目前,关于博弈论的定义尚无一个统一的说法,其所研究的主要是博弈主体之间发生行为相互作用时的决策,以及这种决策的均衡问题。简而言之,博弈论研究的是在不同的竞争与合作环境中,应如何进行决策,以便让博弈主体获得最有利的建设方法和实施方案[3] ~ [5]。

尽管博弈论在许多领域都有着广泛的应用,但如何将博弈论应用于高校科研团队的建设中,目前在理论研究方面尚比较缺乏。本文从博弈论这一全新的视角,对高校科研团队建设中存在的教育与科技主管部门、高等学校、高校教师三方的博弈关系进行研究,探讨了高等学校在协调三方关系中的重要作用,并提出了相应的对策与建议。

二、高校科研团队建设存在的问题 从博弈理论的视角来看,形成博弈关系的前提是:一方面各方都有相对独立的利益和目标,拥有独立做出决策的自[6];另一方面,各方的利益又是相互联系和相互依赖的,一方的行为会直接影响到另一方的行为以及目标的实现[7]。在高等教育现行的运行机制下,高校科研团队建设主要涉及了教育与科技主管部门、高等学校及教师三方的利益,三方既相对独立,又相互联系、相互依赖,在客观上形成了多方博弈的关系。

教育与科技主管部门关注的是如何提升高校在促进社会科技与文化建设以及国民经济发展中所具有的贡献能力,其目的是实现教育投资效益的最大化。为此,应不断强化教育的规范化管理,建立多种奖励制度与评价机制,根据社会发展的需要调整高等教育的专业设置与科研重点,从而促进高校在教育与科研上的快速发展。高等学校关注的是应如何在与同类高校的竞争中立于不败之地,其目的是为了获得更多的教育资源。因此,高校不断地推出各种举措,积极招聘所需人才并为他们搭建各类科研平台,努力形成高水平的科研团队,不断提升本校的科研水平与影响力,通过开展各类精品课程的建设,推进教学质量工程建设的步伐,提高教学的质量,在各种评价中力争取得更好的成绩,从而争取获得更多的教育资源与更广阔的发展空间。高校教师所关注的则是自己感兴趣的学术问题以及与个人的发展有关的问题,他们有自觉申请科研项目、发表研究论文和申报专利以及改进教学质量的主观愿望,并力争在高校的评价中获得好评,以便获取更好的发展空间。可见,各方的利益与关注点既有差异,也有交集,只有协调好上述关系,才能实现多赢的局面。这里仅以高校科研团队建设过程中存在的博弈关系为例进行分析。

1.一些教师中出现急功近利、学术造假现象

高水平的科研团队是建设高水平研究型大学的关键,科研团队建设不仅为各研究型高校(如“211”和“985”重点大学等)所重视,而且也成为一些地方高校谋取快速发展的重要途径。科研团队建设往往伴随着教育与科技主管部门的重点投入、高校自身的政策扶持以及高校教师的个人投入与利益取舍等问题。教育与科技主管部门希望其对科研团队的投入能够显著提升高校的科研和教学的水平,形成系列科研成果,包括发表更多的高水平论文及获得更多国家级或省部级项目、科技奖项或发明专利等。因此,作为主管部门其会依据一系列的指标对科研团队所取得的科研成果进行验收,并与同类高校进行横向对比,以决定下一期是否继续重点投入的问题。在这种情况下,各高校出于对自身利益的保护以及发展的需要,会更加重视科研产出,并通过制定内部激励政策,促进高水平成果的形成,同时也会相应地提高对研究团队中教师的考核标准。也就是说,高校教师加入科研团队就意味着在获得一定科研资源的同时,必须每年都有较高质量的科研成果产出,这对于一些前期工作做得较为充分的教师来说是能够完成的,但对于年轻教师、刚刚留学回国或改变研究方向的教师来说,这种考核所带来的压力就显得格外难以承受,因为在研究的起步阶段就要求出成果,显然违背了客观规律。为了适应考核的需要,一些研究者出现了急功近利的思想,并形成了浮躁的学术风气,甚至出现了学术造假事件。

2.博弈三方及团队成员地位及条件不对等

分析发现,教育与科技主管部门、高校和高校教师在科研团队建设问题上存在着两种主要的博弈关系。第一种是非零和博弈关系[8],体现在三方的目标和最终利益的一致性上。在加强高校科研团队建设的过程中,教育与科技主管部门能够有效地实现教育投入的最大化,高校能够迅速形成学术特色,并具备了高水平的研究能力,而科研团队成员则可以获得科研经费上的支持,实现自身的学术追求。可以说,抓好高校科研团队的建设是一件多赢的事,其体现出来的是一种非零和博弈关系。第二种关系是主从博弈关系[9],体现在三方及科研团队内部成员在博弈过程中地位与条件的不对等性上。在我国现行的管理体制下,高校科研团队需要同时向经费资助方(教育与科技主管部门)和行政管理方(高校)负责,完成所需要的科研产出,及时向上述部门汇报相关研究的进展情况,接受相应的管理与评价考核;同时,高校科研团队一般只配备少数固定的研究或实验人员,其骨干主要是由高校教师构成的,因此除科研工作外,团队成员还要承担相当多的教学任务,在行政关系上要接受学校、学院(或系)和团队的三重管理。因而,科研团队中的教师不同于中国科学院或其他专业研究单位的专职研究人员,其所承担的任务具有多样性,其所处的行政管理关系极具复杂性,在“多对一”的主从博弈关系中处于从属地位。

3.人才外流,管理目标难以实现

此外,教育与科技主管部门、高校及高校教师在科研团队建设问题上的博弈关系并非一成不变的,其会因实际情况的不同而发生变化,其中高校的地位和作用是非常重要的。高校一方面作为高等教育服务社会的主体,是教育与科技主管部门所制定的科研与教学目标的具体执行者;同时,作为高校科研团队的管理者,它又掌控着科研团队的组建、投入与考核等。如果高校在政策制定与管理上出现偏差,不仅会使教育与科技主管部门制定的科研目标无法实现,而且也会激化其与团队成员之间的矛盾。最为常见的问题是考核指标与考核模式不合理,如要求SCI、EI或ISTP三大索引论文及发明专利的数量过多、科研获奖指标不现实、对青年教师在教学科研工作量方面的要求过高等。此外,在引进人才方面,很多高校近年来着力引进那些获得过各类荣誉称号或资助的人员(如长江学者、杰出青年基金获得者、中国科学院百人计划人员、教育部新世纪人才计划奖获得者等),为其提供优厚的待遇,并以其为中心打造科研团队,这种做法通常可以快速提升科研团队的研究水平与影响力。但是,在待遇上过大的差异性同样会导致科研团队内部人员心理的不平衡,特别是这种做法常常会导致过分地注重“主角”而忽视了“配角”,人为地造成了过大的地位差异,影响了部分有潜力的团队成员的正常发展。可以说,高校政策的制定与管理的失当可能导致教育与科技主管部门、高校及高校教师三方利益的严重冲突,使博弈关系走向非合作的零和关系,大量年轻有为的人才外流,科研、教学与行政管理目标难以实现。因此,抓好高校科研团队建设的问题,本质上就是要解决高校自身的政策制定与评价机制的问题。

三、高校科研团队建设的对策 从博弈论视角来研究高校科研团队建设中存在的问题,可以方便地解析出隐藏在表象背后的教育与科技主管部门、高校、高校教师三方的利益关系,从而找到解决问题的方法。基于前面对博弈关系的分析,我们认为解决问题的关键在高校。因此,我们对加强高校科研团队建设提出以下几点对策:

1加快高校体制改革,完善科研团队的管理机制

自19世纪初洪堡在德国柏林大学倡导“通过科研进行教学”和“教学与研究统一”的思想开始[10],以教学为核心,科研为教学的扩展和延伸的高等教育理念获得了广泛的认同。高校科研团队作为科研和教学的骨干力量,其建设问题对提升高校的科研和教学的水平以及声誉意义重大。高校目前在行政上采取传统的“学校―学院(系)―教师”的纵向管理模式,科研团队尚未作为相对独立的行政单位被纳入到管理体制当中,团队常常作为一个虚拟的机构,对其成员通常是没有管理权和制约能力的;另一方面,科研团队既要对教育与科技主管部门负责,又要对高校的行政管理部门负责,由此团队的科研带头人通常只有学校或学院(系)的领导才能胜任。如何将科研团队纳入行政管理体制中,同时防止出现新的条块分割,是高校管理者需要认真思考的问题。我们认为,以任务流(或称工作流)的方式来组建科研团队,在获得教育与科技主管部门资助期间,可将其作为临时的行政管理单位,对其进行独立考核,使科研团队拥有相对独立的管理权和决策权,任务结束后该科研团队自动解散,人员回归学院(系)。这种办法可能在强化科研团队建设的同时,弱化了科研活动过程中外在事务的影响力,进而提高了科研团队的工作效率和影响力[11]。

2.尊重科研的客观规律,为团队成员创建人性化、可持续发展的科研环境

科学研究本身是理论与实践相结合的过程,是对未知或未确定的事物进行探索的认识过程。科技成果对提升人类的生产能力与生活质量的巨大作用是有目共睹的,但是要获得科技成果,需要的不仅仅是物质上的投入,还需要科研人员在精力、时间上的大量投入和充分的学术交流。因此,科学研究不同于企业生产,不能指望投入即产出,更不能仅以工作时间(工时)的长短来衡量科研成果水平的高低。国内外高校的成功经验都表明,科研产出的过程就像农业生产一样,是一个自然的过程,需要合适的环境、适当的投入与维护和一定的时间。良好的科研环境应具有如下特征:1)平等基础上充分的学术交流与协作,这是开展团队合作的前提;2)建立有针对性的、适宜的考核指标体系,对刚刚从事研究工作的团队成员来说,千万不要急于求成,应给他们留出适当的工作积累时间,使之能够沉下心来把工作做扎实,出真正的高水平成果;3)团队的带头人和骨干需要在团队内部树立正面的、令人信服的榜样,不以势压人,要能主动与团队成员进行沟通与联系,协调团队工作,形成和谐顺畅的工作环境。总之,建立良好的科研环境、获得高水平的研究成果都是需要时间的,但做好这项工作的关键还是在于人,因而团队带头人和骨干的人品是非常重要的。

3建立高效、合理的激励与评价体系

篇10

关键字:合同能源管理;节能;利益分配;纳什谈判解

中图分类号:F274

一、引言

能源紧缺是影响全国乃至全球发展的重要瓶颈,中国已成为全球第一能源消费国,而根据“十二五”规划,到2015年我国一次能源消费总量必须控制在42亿吨标准煤以内,这意味着未来几年内我国节能降耗的任务将十分艰巨,但同时也意味着未来我国节能市场潜力非常巨大。

合同能源管理是国际上20世纪70年代逐步发展起来的一种全新的节能机制。在世界银行(WB)的帮助下,合同能源管理于1998年引入中国,并迅速发展起来。其实质就是用客户未来减少的能源费来支付节能项目的全部投资并分享其节能效益的商业模式。节能效益分享型是合同能源管理的三大运营模式之一。在这种模式下,用能企业和节能服务公司签订节能服务合同,并约定合同期内的效益分配比例。用能企业不需要支付任何改造和服务费用,而由节能服务公司对项目进行融资,提供资金和服务,并在客户配合下实施节能项目。合同期满后,项目节能效益和节能项目所有权归用能企业所有。

合同能源管理要发展,成功的关键是节能服务公司和用能企业双方都能够受益,达到合作双赢的良好愿望,而双方都能够分享节能效益的前提是制定合理的效益分享原则。但目前,合同能源管理在我国尚处于发展初期,节能效益分配还没有科学合理的方法和原则,因而在很大程度上制约和阻碍了合同能源管理模式在中国的发展。本文运用合作博弈理论,将用能企业和节能服务公司作为参与双方,构建了二人合作博弈模型,应用纳什谈判解很好的解决了节能效益分享型合同能源管理中的利益分享问题。

二、纳什谈判公理:一个分析框架

合作博弈是研究人们达成合作时如何分配合作所得到的利益,即利益分配问题。在20世纪50年代,纳什创造性的发展了合作博弈理论,并用公理化的方法构建了二人讨价还价模型。合作解完整、公正,体现了美感,弥补了在非合作博弈中,纳什均衡对效率考虑的缺失。如何使局中人能得到的收益达到公平合理,纳什给出了纳什谈判公理,并推导出纳什谈判解的结果。

合作博弈必须遵守如下假设:

第一,合作博弈允许两位局中人在博弈前进行协商。

第二,合作博弈中局中人一旦达成协议,则协议即产生了强制约束力,双方必须遵守。

纳什方法的基本思想是,如果局中人同意把这几条公理作为一般原则,那么他们自己就可以在任何情况下应用符合这些公理的仲裁程序而不必求助于实际的仲裁人。纳什公理体系如下:

公理1(个体合理性) (F,U)≥U,即 (F,U)优超于U;

这一原则表明,用能企业和节能服务公司在通过合同能源管理合作后,其收益要比不合作时多。合作不能损害双方利益,否则局中人会退出合作。

公理2(可行性)(F,U)∈F;

公理2表明,双方的谈判解是可行的。

公理3 (帕累托最优性) 若 (F,U)∈F,且对F中任何一x,若x≥ (F,U),则x= (F,U);

这一公理表明,博弈的局中人只关心帕累托最优赢得,实施合同能源管理后,其最终的节能效益分配方案是最优的,优超于其他分配方案,更确切的说,这至少使其中一方得到的效益更多。

公理4(无关方案的独立性) 若有任意凸集G,若,且(F,U)∈G,则(G,U)=(F,U);

这一公理表明,在双方谈判过程中,扩充的方案仍在原方案范围中,那么增加的谈判方案不会影响原来的谈判结果。

公理5表明,节能效益分配方案与其结果有线性关系,使得局中人的收益可以用效益函数来表示。

公理6表明双方的地位是平等的,且当双方谈判的基点相等时,他们的收益是相等的。

满足上述6条定理的节能效益分配方案,以谈判双方的利益为出发点,又体现了个体的理性。不仅符合公平公正的原则,又考虑到了效率问题。这种分配方案的合理性会被双方接受,从而保持合作。

在上述公理体系基础上,纳什证明了纳什谈判解的存在及合理性。在用能企业和节能服务公司的合作博弈过程中,存在唯一的解(F,U),且这个解满足公理1:

三、应用算例

应用算例包含模型假设和应用两个部分。

(一)模型假设

节能服务公司和用能企业之间的合作就是一种合作博弈的关系。对于双方而言,合作所创造的利益至少不低于不合作时所创造的利益,否则他们不会达成一致。

根据利益分配协商的纳什谈判解,我们可以构建用能企业与节能服务公司之间二人合作的节能利益分享模型。设P为实施合同能源管理后总的节能收益, 为第Ui(i=1,2)个效用函数,双方谈判的起点为向量U=(U1,U2),它表示在合同能源管理过程中,用能企业与节能服务公司各自愿意接受的节能利益分配的下限值。则二者的利益分配向量为X=约束条件(1)说明:二者分配的利益之和即为实施合同能源管理后总的节能效益

约束条件(2)说明:实施合同能源管理后分配的利益不小于非合作状态下各自的收益。

根据前文公式1,我们可以推导出用能企业和节能服务公司利益分配模型的解。通过对公式 (F,U)进行一阶求导,又知 X1+X2 =P,我们可以求得:

(二)模型应用

辽宁省某供暖中心的供热对象大多是20世纪80年代初期的建筑,且原来的设备比较落后,耗煤量很大,存在较大的能源浪费现象。对此,该供暖中心引进了合同能源管理项目,并约定采用节能效益分享型的合作模式。签订能源服务合同后,节能服务公司投资200万元(从银行贷款)从技术、设备、管理等方面实施了全方位节能项目改造工程。合作后总的节能收益为180万元/年;若不合作,那么该供暖中心节能收益仅为5万元(只能通过减少浪费和不必要的能源损耗等简单方式来进行节能),节能服务公司收益为零。双方签订了合作协议:第一年,节能服务公司获得全部收益,第二年、第三年、第四年节能服务公司与供暖中心按比例分享节能收益,第四年以后,节能收益全部归辽宁省某

即得纳什谈判解为(92.5,87.5),那么,第一年总节能收益为180万元,节能服务公司得到全部收益;第二年、第三年和第四年每年总节能收益均为180万元,其中供暖中心分配92.5万元,节能服务公司得到87.5万元。第四年以后,供暖中心获得全部节能收益。

我们将合同期内(前四年)双方的节能收益水平进行统计,如表3-1所示,

将供暖中心和节能服务公司合作前后收益水平变化情况进行比较,如表3-2所示:

由表3-2可以看出,供暖中心和节能服务公司的收益均有不同程度的上涨,并且供暖中心的收益增长增加稍多,而且从第四年以后,供暖中心会获得全部节能收益。这对于用能企业本身来说,没有承担任何风险,便能取得逐年递增的节能效益;对节能服务公司来说,完全取得了“借鸡下蛋”的收益效果。这样更有利于调动用能企业进行节能改造的积极性,同时也让节能服务公司得以生存、发展和壮大。

四、结论及引申

本文运用合作博弈理论,将用能企业和节能服务公司作为参与双方,构建了二人合作博弈模型,应用纳什谈判解很好的解决了节能效益分享型合同能源管理中的利益分配问题。通过以上研究可得如下启示:

第一,通过合同能源管理节能模式在企业中的应用,不仅大大减少了资源浪费,还增加了用能企业的额外收益,调动了企业节能减排的积极性,也让节能服务公司得以生存发展。

第二,节能收益的分配方案,即纳什谈判解的基础是以公平公正为原则,所以博弈双方易于接受,从而达成合作。

第三,纳什谈判解计算较为简便,避免了合作双方无休止的讨价还价过程和繁琐的计算程序,因而节省了时间成本和机会成本,使双方尽快达成一致。

第四,基于纳什谈判公理6,不难发现,我们研究的是在谈判主体双方地位平等情况下的合作,因此,若一方处于垄断地位,则不适合应用本方法。值得注意的是,合作博弈考虑了更多的道德因素,但是在现实社会中,人们为了追求经济利益的最大化,往往忽略了道德因素,因此,纳什谈判解或许更适合商业道德和素质较高的企业间的合作。此外,纳什谈判解倾向于平均主义,需要进一步引进市场竞争因素来规范合同能源管理节能效益的分配机制。

参考文献:

[1] 王秋林.合同能源管理(EMC)应用研究[J].煤炭经济研究,2008,(12).

[2] 约翰·纳什.纳什博弈论论文集[M].北京:首都经贸大学,2003.

[3] 艾克里·拉斯穆森.博弈与信息-博弈论概论[M].北京:中国人民大学出版社,2009.

[4] 汪贤裕,肖玉明.博弈论及其应用[M].北京:科学出版社,2008.

[5] 杨国巧.基于博弈论的农业产业化经营利益分配模型[J].全国商情,2007.

[6] 李翔鹏 .基于讨价还价理论的节能效益分享型EPC模式利益分配研究[D].天津大学,2010.

[7] 顾新,郭耀煌,罗利.知识链成员之间利益分配的二人合作博弈分析[J].系统工程理论与实践,2004,(7).

[8] 王敬敏,王李平.合同能源管理(EMC)机制的效益分享模型研究[J].能源技术与管理,2007,(4).

[9] 武德俊,柳晓雷.合同能源管理(EMC)运作模式及典型案例[J].节能与环保,2010,(3).

[10] 邢薇,韩宁,刘琰等.合同能源管理(EMC)在电力企业中的运用[J].中国市场,2011, (45) .

[11] 许艳,李岩.建筑合同能源管理(EMC)中的博弈关系[J].经济环境,2009.

[12] Vine E.An International Survey of the Energy Service Company Industry[J].Energy Policy,2005.

[13] Zhang Xiaohong,Li Xin,Chen Shouli. Problem and Countermeasure of Energy Performance Contracting in China [J] .Energy Procedia,2011 ,(5).

[14] Steve Sorrell.The Economics of Energy Service Contracts[J] .Energy Policy,2007,(35).

篇11

引言

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

篇12

【关键词】古诺模型;博弈;信息;理性假设

Rationality Assumption in Cournot Game Model

WANG Qiao

(Faculty of Science, Jiangsu University, Zhenjiang Jiangsu 212013, China)

【Abstract】Information is an essential notion in game theory research. It needs to specially consider how much players know about the market information in analysis of Cournot game model. In this article, it first describes the assumption of complete rationality in Cournot output game based on complete information. It also shows three different expectations of players under incomplete information, including naive expectation, adaptive expectation and bounded rationality. It deduces that the assumption of players’ types differ under differnet information condition and then effect the model result of game.

【Key words】Cournot model;Game;Information;Rationality assumption

0 引言

在博弈理论的研究中,信息是一个基本的概念,指的是参与人在博弈过程中所能掌握的知识,包括“自然”的选择和其他参与人的特征等。比如,在新能源投资博弈问题中,市场的需求、政府的补贴政策、投资商A或B的投资与否、不同情况下的收益等都是知识,而投资商A、B知道这些知识的本身也是一种信息。根据博弈的参与人对信息了解的程度,可将信息分为完全信息和不完全信息,其中完全信息表示每一个参与人对所有参与人的策略空间和收益函数等知识有着充分的了解,而只要有一个参与人不完全了解其他参与人的收益函数信息,那么信息就是不对称的,也就是不完全信息。基于此,本文将分别围绕完全信息和不完全信息情境下对古诺博弈模型中的参与人理性假设问题进行探讨分析。

1 完全信息下古诺博弈模型的理性描述[1]

完全信息下古诺博弈模型对参与人的假设是完全理性的,可简要描述为:假设市场上有生产同质产品的两个寡头企业,分别记为企业1和企业2,他们了解市场的全部知识,包括对手的特征和利润函数,选择的博弈策略均是生产的产量。设两家企业在某时期生产产品的数量分别为q1和q2,总供给Q=q1+q2;产品的价格为p(Q),是市场总供给量的递减函数;不考虑固定成本,企业i的生产成本为Ci(qi),i=1,2。两企业同时选择产量策略,以实现利润的最大化。那么,企业i的利润函数为:

πi(q1,q2)=p(Q)qi-Ci(qi), i=1,2(1)

若策略组合(q■■,q■■)是纳什均衡,则其应满足如下两个企业利润函数的一阶条件,

■(2)

解上述方程组即可得到每家企业为获得最大收益的最优产量。可以通过验证下列矩阵是负定的,从而确保所得的解为纳什均衡。

2 不完全信息下古诺博弈模型中的理性假设

以上对经典古诺产量博弈参与人的完全理性假设,意味着参与人具有超强的信息捕捉能力,他们不仅了解对手、资源等市场情况同时能够预测未来,具有在确定和不确定性环境中追求自身利益最大化的判断和决策能力,并能够在此基础上准确地作出最优决策。这不仅要求参与人自身要具有完全理性,同时要求参与人互相信任对方的理性,有着理性的共同知识。然而随着社会经济的不断发展,这种完全理性假设的弊端日渐明显,现实生活中的行为参与人也不可能具有完全理性并熟知对手的决策行动。

在对古诺产量博弈模型的深入研究过程中,考虑到现实环境的复杂性和人类认知计算能力的局限性等,学者们逐步弱化对参与人具有完全理性的基本假设,并提出了与不完全信息相符的理性预期假设。博弈主体根据假设的期望类型估计对手在未来的决策行为,并在此基础上制定自己的最优策略。显然,不同形式的预期将会影响企业的微观决策方式。

这里考虑古诺产量博弈中两相邻经济时期企业的产量决策过程,记企业i在t时期的产量为qi(t),则其在t+1时期的产量qi(t+1)是如下最优化问题的解:

■(3)

其中,q■■(t+1)表示企业j对其竞争对手i(i=1,2,i≠j)在t+1时期产量决策行动的预期。若最优化问题(3)有唯一解,将其记为:

■(4)

则函数f和g称作最优反应函数。

首先,放弃参与企业对其竞争对手产量决策行为了如指掌的严格限制,幼稚期望和适应性期望相继被用于参与人预期类型的假设。若参与人均具有幼稚期望[2],则企业j认为对手i在下一时期的产量生产决策和当期相同,即q■■(t+1)=q■(t),i=1,2。于是式(4)中的两反应函数所定义的离散动力系统为:

■(5)

若参与人均具有适应性期望[3],那么每个参与人预测竞争对手在下一时期的决策行动不再是简单地保持当期的产量水平,而认为是当期对手的实际产量水平和前一时期对手产量水平预期的权重之和,也就是q■■(t+1)=q■■(t)+?淄(q■(t)-q■■(t)),i=1,2。从而式(4)中的两反应函数所表示的离散动力学模型为

■(6)

不难看出,具有幼稚期望的参与人过于理想化,而幼稚期望是适应性期望的一个特例。(下转第23页)

(上接第9页)其次,学者提出参与人不具备完全的市场需求知识,而是通过预估或计算得到产品的边际利润信息来调整自己的产量生产决策,从而实现局部利润的最大化。当参与人观测到的边际利润大于零时,其会加大生产力度;相反地,若边际利润为负,则会减少产品的生产量。如上根据局部边际利润调整产量策略的行为参与人被定义成是有限理性的或是具有有限理性预期的[4]。相应的产量动态调整方程为:

■(7)

式中的α■(q■(t)),i=1,2,指的是企业i对单位产品利润的反应调整速度。

3 结束语

本文从信息视角,分别讨论了完全信息和不完全信息条件下,古诺博弈模型中参与人的理性假设问题。在完全信息条件下,古诺产量博弈模型中的参与人具有完全理性;在不完全信息下,古诺博弈模型中的参与人具有三种理性预期,包括幼稚期望、适应性期望和有限理性期望,博弈主体将根据假设的期望类型来估计对手的决策行为,并在此基础上制定自己的最优策略。

【参考文献】

[1]肖条军.博弈论及其应用[M].上海:三联书店,2004:58-59.

[2]Theocharis R D. On the stability of the Cournot solution on the oligopoly problem[J]. The review of economic studies, 1960,27(2):133-134.

篇13

关键词 博弈;不完备偏好;序贯均衡;纳什均衡;颤抖手完美均衡

中图分类号 F016 文献标识码 A

Sequential Equilibrium in Extensive Games with Incomplete Preferences

SHI Qi 1,2, CHEN Yiqing 1

(1.School of Economics and Management, Nanchang University, Nanchang, Jiangxi 330031,China;

2.School of Economics, Shanghai University of Finance and Economics, Shanghai 200433,China)

Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given, and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.

Key words game;Incomplete preference;Sequential equilibrium;Nash equilibrium;Trembling hand perfect equilibrium

1 引 言

上个十年不完备偏好理论得到了复兴[1-3]. Bade[4]把它应用到博弈论中, 广泛地探讨了在参与者具有不完备偏好时的纳什均衡概念. Bade将经典纳什均衡概念扩展到不完备偏好的环境下, 发现一个博弈的纳什均衡恰好就是该博弈的所有完备化博弈的纳什均衡集的并集. 而且, 如果不完备偏好可以被一个多效用函数[1]所表示, 那么在一定假设下, 纳什均衡集恰好就是该博弈所有线性完备化博弈的纳什均衡集的并集.

纳什均衡是博弈论中最重要的解概念, 但是, 它可能会给出了太多均衡; 当博弈存在不完美信息的时候, 它甚至可能造成误导. Kreps和Wilson提出的序贯均衡[5]是纳什均衡的精练, 其基本思想在于均衡不仅应该描述参与者的策略, 还要描述参与者在每个信息集上关于究竟是哪个历史发生了的信念. 一个很自然的问题是: 当去掉完备偏好的假设, 是否仍然能够定义一个序贯均衡的概念, 使得它在每个有限扩展式博弈都存在呢?与Kreps和Wilson类似, 想使用原扩展式博弈的人标准式表示的颤抖手完美均衡来证明序贯均衡的存在性. 然而, 对于不完备偏好, 颤抖手完美均衡可能不是一个纳什均衡. 幸运的是, 任意有限博弈都有一个颤抖手完美纳什均衡(THPNE), 这样就能得到与Kreps和Wilson类似的结论.

2 基本概念

在本文中, Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}表示一个完美记忆有限扩展式博弈. 其中, N为有限的参与人集合, c为自然, H为历史集合, P 为参与人函数,fc为每个P(h)=c 的历史h指定一个A(h)上的概率测度fc(・|h)), 而且, 集合Ιi∈Ii为参与人i的一个信息集.

终结历史集合标记为Z. 每个参与人i∈N拥有一个定义在Z上的(可能为不完备的)偏好关系≥i.假设每个偏好关系≥i都是传递的, 反身的, 但是, 与经典理论不同, 不一定是完备的. 参与人 i 在 x和y之间无差异, 标记为x~iy, 当且仅当x≥iy 且y≥ix. 参与人 i 严格偏好x甚于y, 标记为x>iy, 当且仅当x≥iy但不是y≥ix.

与不完备偏好表示理论的最近文献[2]相似, 考虑偏好关系≥i 是可以被函数表示的, 也即, 存在一个函数u:ZRn使得x≥y当且仅当u(x)≥u(y). 在下文中, 将用Γα:={N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈N}表示博弈

Γα:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}, 其中函数ui:ZRmi表示偏好≥i. 更具体而言, 对于任意向量α={α1,…,αI},αi∈Rmi, 定义一个博弈

Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I,

其中, αiui:ZR定义为αi和ui的点积, 或αiui=∑mij=1αijuij. 进一步的, 定义

Δ:={α={α1,…,αI},αi∈Δmi,i},

经 济 数 学第 29卷第1期时 奇等:不完备偏好扩展式博弈的序贯均衡

Δ+:=Δ∩R∑mi+ +,

其中,Δmi表示mi-1维单纯形.

如果≥′和≥都是定义在Z上的偏好关系,≥≥′且>>′, 那么称≥′是≥的完备化. 说一个扩展式博弈Γ′:={N∪{c},H,P,fc,(Ii)i∈N,(≥′i)i∈N}是另一个扩展式博弈Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}的完备化, 如果对于每个参与人i, ≥′i都是≥i的完备化. 那么, 对于任意αi>>0, 函数αiui代表了由ui所代表的偏好关系的完备化. 因此, 对于任意α∈Δ+, 博弈Γα是原博弈Γ的线性完备化.

仿照Kreps和Wilson的证明方法, 考虑博弈Γα的人标准表示(ANFR)[6]. 但在此之前, 给出一些术语. 用Ii标记参与人i应该行动的那些信息集的集合, 用 s 标记任意信息集, 用 i.s 标记应该在信息集s∈Ii行动的那个人. 而且, 用Ds标记信息集s可以采取的行动; 更具体的说, 如果知道在信息集s采取行动的应该是参与人i, 那么称他可以采取的行动集为Di.s. 那么, 博弈Γα的ANFR可以表示为

Γaα:={I∪{c},(Di.s)i.s∈I,(ui)i∈N},

其中, I表示所有人的集合.

3 纳什均衡和颤抖手完美均衡

给定博弈Γα, 定义人 i.s 的最优反应映射BRui,使得

BRui(σ-i.s):=arg max di.s∈Di.sui(di.s,σ-i.s),

其中,-i.s表示除i.s之外的其他人. 那么, 对于任意y(σ-i.s)∈BRui.s(σ-i.s), 给定其他人的行为策略σ-i.s, 不存在y′(σ-i.s)使得(σ-i.s,y′(σ-i.s))>i(σ-i.s,y(σ-i.s)).

对于博弈Γa的完备化Γaα, 也可以定义参与人i.s的最优反应映射BRαiui使得

BRαiui(σ-i.s):=arg max di.s∈Di.sαiui(di.s,σ-i.s).

定理1 对于所有人i.s, 以及所有αi∈Δmi+,有

BRαiui(σ-i.s)BRui(σ-i.s).

证明 用反证法. 假设定理1不成立, 那么必存在σ-i.s和di.s使得 di.s∈BRαiuiσ-i.s但di.s∈BRuiσ-i.s成立. 这样必存在d′i,s使得di,s. 因为αi∈Δmi+, 那么αid′i,s>αidi,s, 这与di.s∈BRαiuiσ-i.s相矛盾.

定理2 对于所有人i.s和所有σ-i.s,BRuiσ-i.s是上半连续的.

证明 因为博弈是有限的, BRuiσ-i.s总是紧值的. 根据最大值定理[7], 有, 对于所有人i.s, 所有αi∈Δmi+, 以及所有是上半连续的. 那么, 对于任意序列(σk-i.s)σ-i.s和yk∈BRuiσk-i.s, 存在yk的一个子序列收敛于BRuiσ-i.s中的一点. 但是, 根据定理1, 有BRαiuiσ-i.sBRuiσ-i.s. 那么BRuiσ-i.s也是上半连续的.

一个随机策略组合σ:=(σ1,σ2,…,σI)是博弈Γaα的纳什均衡, 如果不存在一个人i.s有策略σ′i,s∈Δ(Di,s)使得(σ′i,s,σ-i,s)>(σi,s,σ-i,s). 将一个扩展式博弈的所有纳什均衡集合标记为NEΓ.

一个随机策略组合σ:=(σ1,σ2,…,σI)是博弈Γaα的一个颤抖手完美均衡, 如果存在一个序列σk∞k=0使得

σk∈×i.s∈IΔ+Di.s,k∈1,2,3,…,

lim k∞σki.sdi.s=σi.sdi.s,i.s∈I,di.s∈Di.s,

σi.s∈arg max uiσk-i.s,τi.s,i.s∈N,

但是, 如果允许不完备偏好, 一个颤抖手完美均衡可能不是纳什均衡, 这与完备偏好情形时是不同的. Bade [4]给出了一个简单的反例,并且建议应该把目光集中在那些也是纳什均衡的颤抖手完美均衡上, 这就产生了一个新概念,即颤抖手完美纳什均衡(trembling hand perfect Nash equilibrium, THPNE). 幸运的是, 在一个有限扩展式博弈的人战略式中, 总是可以找到一个THPNE, 这一点由Bade[4]的推论1所保证.

定理3 (Bade)任意有限博弈Γaα都有一个颤抖手完美纳什均衡.

4 序贯均衡

现在进入到本文的核心部分, 原博弈Γ的序贯均衡的存在性. 先考虑这样一个评估σ,μ[8], 其中σ为行为策略组合, μ为一个这样的信念函数:为每个信息集的历史指定一个概率测度.

定义, 结果Oσ,μs为给定信息集s已达到由行为策略σ决定的终结历史的概率分布. 一个评估σ,μ是序贯理性的, 如果对于每个参与人i∈N和每个信息集s∈Ii不存在一个σ′i,s使得

O((σ′i,s,σ-i,s),μ)>iO((σi,s,σ-i,s),μ).

注意到对序贯理性的定义不同于经典定义, 这是因为在结果空间引入了不完备偏好.

说一个评估σ,μ是一个扩展式博弈Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I的序贯均衡, 如果σ,μ是序贯理性的且具有一致性. 一致性的定义是标准的[5].

定理4 假设Γα:{N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈I}为一个完美记忆扩展式博弈, 且σ为Γα的人标准式表示的一个颤抖手完美纳什均衡. 那么必存在一个信念向量μ使得σ,μ为Γα的一个序贯均衡.

证明 对于博弈Γα中的任意参与人i,用s表示Ii中任意信息集. 那么s中的历史集合被表示为Hs. 以Xs表示不被Hs中所有节点所达到的终结历史集合;以σ∞k=1表示在×r∈IΔ+Dr中的行为策略组合序列. 对于Γα的人标准式表示而言,它们既是颤抖手完美均衡又是纳什均衡. 对于任意k和Hs中的任意h, 令

μksh=Phσk∑g∈HsPgσk,

其中, Phσk代表如果该博弈按照σk进行给定信息集s达到而历史h达到的条件概率. 注意到对于任意h∈Hs有Phσk>0, 那么∑g∈HsPgσk>0. 令

μsh=lim h

那么μ为一个与σ一致的信念向量.

令vs(・)表示ANFR中人i.s的效用函数. 当这个人使用随机策略ρi.s∈ΔDs, 而其他人使用σk规定的策略 (可能包括了该参与人的其他人). 给定历史h达到, 人i.s使用随机策略ρi.s, 其他人使用σk-i.s, 令Uiσ-i.s,ρsh代表此时参与人i的期望多效用函数. 那么,

vsσk-i.s,ρs=∑h∈HsPhσk-i.s,ρsUiσk-i.s,ρsh

+∑x∈XsPxσk-i.s,ρsuix

=∑h∈HsPhσkUiσk-i.s,ρsh

+∑x∈XsPxσkuix

=∑g∈HsPgσk∑h∈HsμkshUiσk-i.s,ρsh

+∑x∈XsPxσkuix.

因为σ为一个颤抖手完美均衡, 有σi.s∈arg max ρi.s∈Δsvsσki.s,ρi.s, 这意味着

σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk-i.s,ρi.sh.

那么, 根据最优反应映射的上半连续性,有

σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ-i.s,ρi.sh.

这就是序贯均衡的序贯理性条件, 因此σ,μ为博弈Γα的一个序贯均衡.

证毕

根据定理3和定理4, 下面的定理成立.

定理5 所有完美回忆的有限扩展式博弈都有一个序贯均衡.

5 结 论

Bade[4]为不完备偏好的标准式博弈定义了纳什均衡的概念,本文是其在扩展式博弈中的扩展。采用 Kreps和Wilson[5] 的思路, 先给出了一个修正的颤抖手完美均衡的概念, 然后应用它去证明不完备偏好扩展式博弈的序贯均衡的存在性. 如何将其应用到博弈论其他领域(例如产业组织理论)中去,将是进一步研究的方向.参考文献

[1] 时奇, 谌贻庆, 陈剑. 不完备偏好理论及其应用综述[J]. 经济评论, 2010, (3):116-123.

[2] E OK. Utility Representation of an incomplete preference relation[J]. Journal of Economic Theory, 2002, 104(2):429-449.

[3] J DUBRA,F MACCHERONI, E Ok. Expected utility theory without the completeness axiom[J]. Journal of Economic Theory, 2004, 115(1): 118-133.

[4] S BADE. Nash equilibrium in games with incomplete preferences[J]. Economic Theory, 2005, 26(2):309-332.

[5] D KREPS, R WILSON. Sequential equilbria[J]. Econometrica, 1982, 50(4): 863-894.

[6] R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games[J]. International Journal of Game Theory, 1975,4(1):25-55.

篇14

关键词:博弈论;兼并;航运企业

中图分类号:F224.32 文献标识码:A 文章编号:1672-3198(2009)06-0019-01

1 博弈论的定义

博弈论又叫对策论,是一门研究游戏中参加者各自所选策略的科学。其准确的定义是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果或受益的过程。与其他理论不同的是,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的决策选择基础上来确定自己的最优行动策略。

2 我国航运企业兼并的博弈分析

中国作为一个航运大国,航运业的发展速度之快是有目共睹的。但随着全球航运企业的不断合并,我国航运企业面对的挑战也是不容置疑的。在这种情况下,我国航运企业必须在联合的基础上,通过适当的途径,达到“双赢的效果”,只有这样,才能在世界航运市场的竞争中立于不败之地。2008年,中外运与长航集团成功整合,拉开了我国航运央企整合的序幕。

(1)中外运与长航的合并模式。

2008年12月19日,国务院国资委正式宣布中外运集团与长航集团重组,中外运集团作为重组后的母公司,更名为“中外运长航集团公司”。两大集团合并前,国资委旗下的航运板块共有5家央企,分别是中远集团、中海集团、长航集团、中外运集团和招商集团旗下的招商轮船。其中,中远集团占五家运力的55%,位居首位,中海运力占25%,余下三家运力所占比例均不到10%。中外运和长航分别是国内航运业排名第三、第四的两家中央企业,合并后新集团的总资产已接近中海集团,在油运、滚装、干散货运输等领域,已与中海集团、中远集团不相上下。此外,新集团在综合物流、燃油贸易、造船等业务上,也在国内居于龙头地位。

中外运业务包括两个主要部分:一个是采用多种模式提供物流服务,主要包括货运、船务、合约物流及速递服务;另一个是航运业务,包括车辆运输业务、本地贸易航运、货船拥有及海上航运业务。与长航相比,中外运的经营业务更广,实力略强。公开数据显示,2008年,中外运集团总资产565亿元,营业收入650亿元,利润总额48.5亿元;长航集团总资产约500亿元,总收入302.4亿元,总利润15.2亿元。

尽管中外运在资产规模上远远大于长航,但在油运、造船等业务方面,长航集团的优势凸显。长航集团的油运业务盈利颇丰,其旗下的上市公司长航油运2007年石油运输收入超过15亿元,利润超过5亿元,拥有运力近170万吨。长航集团的造船业务在整个集团中的比重很高,主造10万吨以下、1万吨以上的船舶,主要用于出口到欧美等市场。2007年长航集团下属7个大中型船厂的总产值近100亿元,占整个集团的1/3,占整个长江沿岸造船企业总产值的20%以上。中外运的远洋油运客户资源,是长航所欠缺的,而中外运运力不足的缺陷也会因长航的加入得到弥补。因此,两大集团的整合,无论从运力、客户资源、航线上,都有一个互补提升的协同作用。

干散货资产方面,中外运与长航集团均具有一定的优势,中外运集团的散货资产主要集中在中外运航运,经营远洋散货运输,而长航集团的干散货资产主要集中在长航凤凰,主营长江干线的散货运输。另外,长航手持大量散货船订单,资金压力较大,而中外运手持大量资金,具备较强的负债融资能力,双方恰好互补,具有很大的整合空间。

目前,两大集团的深度整合方案还在酝酿之中,但已决定开展业务层面的合作,如:中外运旗下的船舶在方便的区域,均要到长航下属的中石化长江燃料有限公司加油;中外运拥有的260个码头,将优先选用长航子公司红光港机生产的设备;中外运计划建造的新船,将由长航下设的造船厂生产;中外运和长航各自拥有的营销网络,将互为、互通有无等。

(2)运用博弈论分析航运企业选择兼并行为的准则。

航运企业和一般企业一样,是以赢利为目的的组织,其行为是以追求企业利益最大化为目标。企业的收益分为两部分:一部分是难以度量的非货币形态的收益,即控制权收益;另一部分是容易度量的货币形态的收益,即货币收益。因而可通过对航运企业收益变动情况的讨论来分析企业间兼并行为发生的条件。

假定:①A,B均为航运市场上具有较强实力的公司,并且A比B具有相对优势。②企业行为是理性的,均以自身利益或效用最大化作为决策的目标。③A、B企业对彼此信息是完全了解的。④企业货币收益(IU)与企业生产效率(P)正相关,控制权收益(Iγ)则与企业规模(S)正相关,即I=IU+IV=f(P,S),且dIU/dP>0,dIV/dS>0。⑤企业合并后生产效率统一。

在A与B的合并中,A企业为主导企业,B企业为从属企业。企业合并行为实际上就是双方基于各自利益最大化的静态博弈过程。如下表所示:

其中,I′A=A企业对合并后收益水平的预期,I′B=B企业对合并后收益水平的预期,IA=A企业现有收益水平,IB=B企业现有收益水平。

①A企业的决策。

设PA+B=合并后预期的企业生产效率,SA+B=合并后预期的规模,PA=A企业的现有生产效率,SA=A企业的现有规模。

I′A-IA=f(PA+B,SA+B)-f(PA,SA)

=f(PA+B,SA+B)-f(PA+B,SA)+f(PA+B,SA)-f(PA,SA)=ΔIUA+ΔIVA

因为SA+B>SA,dIV/dS>0,所以ΔIVA>0。

若合并后生产效率上升,即PA+B>PA,由dIU/dP>0可知ΔIUA>0,则I′A-IA,A企业选择合并。

若合并后生产效率降低,即PA+B

当ΔIVA>|ΔIUA|,即A企业从生产规模扩张中所得的控制权收益大于因效率降低而损失的货币收益,此时,I′A>IA,A企业选择合并。

当ΔIVA

②B企业的决策。

I′B-IB=ΔIVB+ΔIUB

企业合并意味着被兼并方(B企业)控制权的损失,控制权收益降低,故ΔIVB

若合并后生产效率上升,即PA+B>PB,ΔIUB>0。①当ΔIUA>|ΔIVb|,B企业因效率上升带来的货币收益大于控制权收益的损失,I′B>IB,B企业选择合并。②当ΔIUA

若合并后生产效率下降,即PA+B

因此,企业在选择兼并行为时会出现以下三种情况:

①当PA+B>PA,PA+B>PB,且I′B>IB,双方合并。即:双方企业的合并,带来A企业规模扩大,生产效率上升,控制权收益和货币收益均有所增加;B企业控制权收益的损失足以被生产效率提高所增加的货币收益弥补。

②当PA>PA+B>PB,且I′A>IA,I′B>IB,双方合并。即:双方企业的合并,带来A企业规模扩大,生产效率下降,但控制权收益的增值足以抵消货币收益的损失;B企业则以控制权收益一定量的损失换来了货币收益较大量的补充。

③其他情况下,双方均不选择合并。

3 结论

中外运与长航的业务具有很大的互补作用,只要整合得当,两大集团必能根据自身追求的目标,在内部进行资源的有效整合和配置,从而增加营运实力,提高控股公司的生产效率。同时,新集团也能够在油轮运输、干散货运输和综合物流上提升自身规模,发挥整体协作效应,产生规模竞争力,增强抵御经济风险的能力。中外运与长航之所以选择合并,是在充分考虑生产效率和企业规模等因素之后做出的选择,由上面分析可以看出,其合并行为更接近于上述企业选择选择合并行为的第一种情况,即:通过合并,处于主导地位的企业货币收益和控制权收益均有所增加,而处于从属地位的企业则实现两大收益之和的增加。

参考文献