文章快速检索    
  同济大学学报(自然科学版)  2017, Vol. 45 Issue (9): 1399-1406.  DOI: 10.11908/j.issn.0253-374x.2017.09.021
0

引用本文  

程东波, 霍佳震. 低回收价值高环境影响末端产品再利用决策分析[J]. 同济大学学报(自然科学版), 2017, 45(9): 1399-1406. DOI: 10.11908/j.issn.0253-374x.2017.05.002.
CHENG Dongbo, HUO Jiazhen. Analysis on Recycling Subject Decision-making Behavior of Low Commercial Value and High Environmental Impact Class End of Life Products[J]. Journal of Tongji University (Natural Science), 2017, 45(9): 1399-1406. DOI: 10.11908/j.issn.0253-374x.2017.09.021.

基金项目

国家自然科学基金(71532015)

第一作者

程东波(1973—),男,博士生,主要研究方向为物流与供应链管理,循环经济产业.E-mail:1255061716@qq.com

通讯作者

霍佳震(1962—),男,教授,博士生导师,管理学博士,主要研究方向为物流与供应链管理,运营管理.E-mail:huojiazhen@163.com

文章历史

收稿日期:2017-01-12
低回收价值高环境影响末端产品再利用决策分析
程东波, 霍佳震    
同济大学 经济与管理学院,上海 200092
摘要:以低回收价值高环境影响(low commercial value and high environmental impact, LCV-HEI)末端产品(end of life, EOL)回收再利用为目的,在LCV-HEI类EOL产品闭环供应链模型运行机制分析的基础上,通过构建演化博弈模型,研究了原始制造商(origin equipment manufacture, OEM)和EOL处置中心群体在市场机制下的长期演化特征,分析了两个群体在演化过程中的策略选择及稳定均衡点.研究结果表明,需要将OEM再制品价格控制在合理区间.此时,(回收,再利用)策略才成为EOL处置中心与OEM群体的唯一策略,这更有利于促进EOL产品的回收及再利用.并且OEM选择再利用策略,不管利润如何,政府对单位产品补贴满足一定条件,可以促进两个群体演化形成唯一均衡点(1,1).
关键词闭环供应链    低回收价值高环境影响末端产品    再利用主体        
Analysis on Recycling Subject Decision-making Behavior of Low Commercial Value and High Environmental Impact Class End of Life Products
CHENG Dongbo, HUO Jiazhen     
College of Economics and Management, Tongji University, Shanghai 200092, China
Abstract: This paper takes recycling of low commercial value high environmental Impact (LCV-HEI) class end of life (EOL)products as purpose. It puts forward an evolutionary game model based on recycling EOL products and gives an analysis about the operation mechanism of closed-loop supply chain model for LCV-HEI class EOL products. It studies the long-term evolution characteristics of OEM and EOL disposal center population under market mechanism; it analyzes the strategy selection and stable equilibrium point of the two groups in the evolution process. The results reveal that OEM remanufacturing prices should be controlled in a reasonable range. At this point, using (recycling, reuse) strategy becomes the only strategy to the EOL disposal center and OEM groups, which is more conducive to promoting the EOL product recycling and reuse. And OEM groups choose the reuse strategies, no matter how the profits are, the unit of government subsidies meet certain conditions, it can promote the evolution of the groups to form the only equilibrium point (1, 1).
Key words: closed-loop supply chain    low commercial value high environmental impact class end of life products    subject of recycling    evolutionary game    

当前,在我国EOL产品回收、处置及循环利用机制面临诸多问题,特别是LCV-HEI (low commercial value high environmental impact)类EOL产品再利用出现“市场失灵”.一是政府与闭环供应链上企业主体的博弈,由于供应链各成员企业的独立决策主体的特征,实施EPR (extended producer responsibility)制度的“正规军”干不过没有实施EPR制度的“游击队”[1-2];二是由于环境效益是公共福利,难以量化,企业在竞争中的“生存诉求”往往会战胜环境“道德风险”,导致企业保护生态环境内生动力不足[3];三是由于EOL产品回收、处置及循环利用是一个复杂的系统性问题[4].客观上要保证LCV-HEI类EOL产品能被高效回收和处置,做到“物尽其用”并不容易,这涉及供应链设计,原始制造商(OEM)对EOL产品的再利用技术开发、原始产品绿色设计、产品专业分类和回收等技术和管理问题[5-6].

当前越来越多的学者将EOL产品回收决策与环境影响相结合,构建新型闭环供应链,并且将演化博弈引入到供应链管理领域,并取得了一定的研究成果[7-9].如郭华军[10]等应用演化博弈理论,研究了在双寡头竞争的背景下,制造商在考虑原始制造与再制造比例关系时所做决策的动态演化过程,同时还研究了适当的政府补贴机制来促使系统达到均衡.何丽红[11]等以政府和低碳供应链上的核心企业为博弈主体构建了动态演化博弈模型,通过分析核心企业和政府不同策略下的收益和成本,得出了政府监管策略的演化稳定策略.在自由市场环境下,政府的环境规制与回收渠道选择都会影响EOL产品的再利用,特别是低回收价值高环境影响EOL产品的充分利用,需要专业的回收和再利用主体,并且要发挥市场资源配置的作用[12-13].因此,需要构建一种环境效益驱动型闭环供应链,并研究相关群体的长期演化规律,对解决LCV-HEI类EOL产品充分回收利用和处置将起到至关重要作用[14-16].

本文在EPR制度下构建一种LCV-HEI类EOL产品双闭环供应链模型,并在其运行机制分析的基础上.通过演化博弈分析,研究分析了OEM和EOL处置中心群体在演化过程中的策略选择及稳定均衡点,为LCV-HEI类EOL产品闭环供应链EOL产品循环利用提供一定的理论基础和技术支持.

1 EOL处置中心、OEM群体演化博弈模型构建 1.1 问题描述

研究面向低回收价值高环境影响EOL产品,为保证产品充分再利用,通过EOL处置中心分类在满足原始制造商1的EOL产品“内循环”的基础上,增加了制造商2“外循环”利用,双闭环供应链运行流程如图 1所示.将政府补贴作为一个外在变量,闭环供应链中EOL产品再利用最关键的流程就是回收和再利用.这样在该闭环供应链中对应的EOL处置中心与OEM构成一个非对称动态博弈.从一个外生市场环境到一个行为策略环境下,回收商给定的行为策略的适应性取决于制造商的行为策略,即回收回来的EOL产品能否会被再制造[17].借鉴已有研究,构建EOL处置中心和OEM群体演化博弈模型,在该动态博弈模型中,各方选择的策略与代表的利益均不相同,双方群体的博弈是在一个具有不确定的有限理性的空间进行的,博弈均衡存在双重约束,彼此的策略相互影响.

图 1 EPR制度下LCV-HEI类EOL产品双闭环供应链运行流程 Fig.1 Dual closed-loop supply chain operation process of LCV-HEI class EOL products in EPR system
1.2 模型假设与参数设定

在EPR制度约束下,OEM为了提高EOL产品再利用效率,通常会委托专业化机构(EOL处置中心)对EOL产品进行回收处置,但如果其回收处置不力,OEM为了避免政府惩罚,则被迫选择自行回收处置.为简化计算,对EOL产品回收处置、再利用及再制品市场交易等相关活动环节进行如下研究假设.

假设1:考虑EOL产品可由EOL处置中心负责回收处置,也可由OEM回收处置;

假设2:OEM生产再制品,但仍要使用部分原材料,该部分原材料比例固定;

假设3:OEM生产的再制品与新产品质量无差异,且低于新产品单价;

假设4:忽略EOL产品回收处理过程中原料损耗,且利用EOL处置品OEM可生产等量再制品;

假设5:只考虑EOL处置品再利用相关活动的收益,且OEM再制品可以被市场全部消费.

根据上述假设,设定模型参数如下:Qt为EOL产品的最大回收量;ct为LCV-HEI类EOL产品回收处理单位成本(包括从消费者手中回收、运输、拆解、处理、分类等费用);α为回收处理后的LCV-HEI类EOL产品只有α部分能重新进入内循环再利用,剩下的1-α部分进入外循环再利用;Q为LCV-HEI类EOL产品对应的市场规模;cm为OEM生产新产品的单位成本(包括原料采购、生产制造);cr为OEM再制造的单位成本(包括所需的部分原料采购、生产制造);pN为OEM生产的新产品单价;pR为OEM生产的再制品单价;pm1为EOL处置中心将EOL处置品转移给内循环OEM的单价;pm2为EOL处置中心将EOL产品转移给外循环OEM的单价;s为再制品单位节约成本,s=cm-(pm1+cr)>0;m为政府奖惩力度,即每单位奖罚款额度;αt0为政府监督标准,当OEM再制造超过αt0,政府对超过部分给予OEM奖励,每单位奖励m,否则会对OEM罚款,不足部分每单位罚款mλ为政府对EOL产品回收量的单位补贴额度;所有参数满足

$ \begin{array}{*{20}{c}} {{p_{{\rm{m1}}}},{p_{{\rm{m2}}}} < {c_t} < \lambda ,m}\\ {{p_{{\rm{m1}}}} + {c_{\rm{r}}} < {c_{\rm{m}}} < {p_{\rm{N}}},{p_{\rm{R}}}}\\ {\alpha {t_0} < \alpha {Q_{\rm{t}}} < Q} \end{array} $
1.3 模型构建

EOL处置中心有回收和不回收两个纯策略:SE1为回收EOL产品;SE2为不回收EOL产品.OEM也有选择生产新产品和再制品两个纯策略:SM1为生产再制品,即再利用;SM2为生产新产品.

EOL处置中心与OEM博弈的扩展形,如图 2所示.

图 2 EOL处置中心与OEM群体的博弈树 Fig.2 The game tree of EOL products disposal center and OEM groups

图 2中,EOL处置中心面临的策略选择是SE1SE2,选择SE1策略,EOL处置中心回收EOL产品,就需要付出回收成本,由于存在EOL处置中心回收的EOL产品不被OEM回收再利用的可能,所以EOL处置中心也有卖不出去EOL处置品而面临损失的风险.

OEM在EOL处置中心决策后再进行决策,面临的策略选择是再利用或不再利用.如果再利用会受到政府的奖励,反之不再利用将会受到惩罚.如果EOL处置中心没有回收EOL产品,但是OEM为了执行EPR制度,而选择自行回收EOL产品,以避免政府的惩罚.假设OEM利用EOL处置品的回购成本小于使用原材料的采购成本,则OEM选择再利用策略.如果在EOL处置中心群体中,选择采取SE1策略的个体比例为x,则选择采取SE2策略的个体比例为1-x,0≤x≤1,OEM群体中,选择采取SM1策略的个体比例为y选择采取SM2策略的个体比例为1-y,0≤y≤1,策略的调整是一个动态调整的过程,即OEM或EOL处置中心的期望收益低于各自的平均收益时,两个博弈方就会在下一次的策略选择过程中改变策略,选择期望收益较大的策略.

2 EOL处置中心、OEM群体演化博弈模型求解

EOL处置中心采取两种策略的利润函数不同,当EOL处置中心采取SE1策略的同时OEM采取SM1策略,则EOL处置中心的利润为πE1πE1>0;当EOL处置中心采取SE1策略,而OEM不采取SM1策略,则EOL处置中心的利润为πE2πE2 < 0;当EOL处置中心不采取SE1策略,不管OEM选择什么策略,EOL处置中心的利润均为0.

$ \begin{array}{*{20}{c}} {{{\rm{\pi }}_{{\rm{E}}1}} = {p_{{\rm{m1}}}}\left( {\alpha {Q_t}} \right) + {p_{{\rm{m2}}}}Q\left( {1 - \alpha } \right){Q_{\rm{t}}} - {c_{\rm{t}}}{Q_{\rm{t}}}}\\ {{{\rm{\pi }}_{{\rm{E}}2}} = {p_{{\rm{m2}}}}Q\left( {1 - \alpha } \right){Q_{\rm{t}}} - {c_{\rm{t}}}{Q_{\rm{t}}}}\\ {{{\rm{\pi }}_{{\rm{E}}3}} = {{\rm{\pi }}_{{\rm{E}}4}} = 0} \end{array} $

当满足同样的产品需求时,OEM采取两种策略的利润函数不同,πM1πM3(πM1>πM3)为制造商采取再利用策略时的利润,πM2πM4(πM2=πM4)为OEM采取不再利用策略时的利润,并假设这4种情况下OEM利润均非负

$ \begin{array}{l} {{\rm{\pi }}_{{\rm{M1}}}} = \left( {{p_{\rm{N}}} - {c_{\rm{m}}}} \right)\left( {Q - \alpha {Q_{\rm{t}}}} \right) + \left( {{p_{\rm{R}}} - {p_{{\rm{m1}}}} - {c_{\rm{r}}}} \right)\left( {\alpha {Q_t}} \right) + \\ \;\;\;\;\;\;\;m\left( {\alpha {Q_{\rm{t}}} - \alpha {t_0}} \right) \end{array} $
$ {{\rm{\pi }}_{{\rm{M2}}}} = \left( {{p_{\rm{N}}} - {c_{\rm{m}}}} \right)Q + m\left( { - \alpha {t_0}} \right) $
$ \begin{array}{l} {{\rm{\pi }}_{{\rm{M3}}}} = \left( {{p_{\rm{N}}} - {c_{\rm{m}}}} \right)\left( {Q - \alpha {t_0}} \right) + \left( {{p_{\rm{R}}} - {c_{\rm{r}}}} \right)\left( {\alpha {t_0}} \right) - {c_{\rm{t}}}{t_0} + \\ \;\;\;\;\;\;m\left( {\alpha {t_0} - \alpha {t_0}} \right) \end{array} $
$ {{\rm{\pi }}_{{\rm{M4}}}} = \left( {{p_{\rm{N}}} - {c_{\rm{m}}}} \right)Q + m\left( { - \alpha {t_0}} \right) $

OEM与EOL处置中心不同策略组合所构成的得益矩阵,如表 1所示.

下载CSV 表 1 OEM与EOL处置中心不同策略得益矩阵 Tab.1 The Matrix of the Strategies of EOL Products Disposal Center and OEM

将EOL处置中心与OEM采取不同策略组合时的期望收益分别表示为PSEiPSMji, j=1, 2,则有

$ \begin{array}{*{20}{c}} {P{S_{{\rm{E}}1}} = y{\pi _{{\rm{E1}}}} + \left( {1 - y} \right){\pi _{{\rm{E2}}}}}\\ {P{S_{{\rm{E}}2}} = y{\pi _{{\rm{E3}}}} + \left( {1 - y} \right){\pi _{{\rm{E4}}}}}\\ {P{S_{{\rm{M}}1}} = x{\pi _{{\rm{M1}}}} + \left( {1 - x} \right){\pi _{{\rm{M3}}}}}\\ {P{S_{{\rm{M}}2}} = x{\pi _{{\rm{M2}}}} + \left( {1 - x} \right){\pi _{{\rm{M4}}}} = {\pi _{{\rm{M2}}}}} \end{array} $

将EOL处置中心与OEM采取不同的策略组合时的平均收益分别定义为$\overline {P{S_{\rm{E}}}} $$\overline {P{S_{\rm{M}}}} $,则有

$ \overline {P{S_{\rm{E}}}} = xP{S_{{\rm{E1}}}} + \left( {1 - x} \right)P{S_{{\rm{E2}}}} = x\left[ {y{\pi _{{\rm{E1}}}} + \left( {1 - y} \right){\pi _{{\rm{E2}}}}} \right] $
$ \begin{array}{l} \overline {P{S_{\rm{M}}}} = yP{S_{{\rm{M1}}}} + \left( {1 - y} \right)P{S_{{\rm{M2}}}} = y\left[ {x{\pi _{{\rm{M1}}}} + \left( {1 - } \right.} \right.\\ \left. {\left. x \right){\pi _{{\rm{M3}}}}} \right] + \left( {1 - y} \right){\pi _{{\rm{M2}}}} \end{array} $

为分析EOL处置中心和OEM两个群体演化过程的选择机制,需要复制动态方程.可以根据Malthusian方程,各博弈方选取策略的数量的增长率应等于其适应度减去其平均适应度,则EOL处置中心选择策略SE及OEM选择策略SM的复制动态方程分别为

$ \begin{array}{l} {f_1}\left( {x,y} \right) = x\left( {P{S_{{\rm{E}}1}} - \overline {P{S_{\rm{E}}}} } \right) = x\left( {1 - x} \right) \cdot \\ \;\;\;\;\;\;\;\left( {P{S_{{\rm{E}}1}} - P{S_{{\rm{E}}2}}} \right) \end{array} $
$ \begin{array}{l} {f_2}\left( {x,y} \right) = y\left( {P{S_{{\rm{M}}1}} - \overline {P{S_{\rm{M}}}} } \right) = y\left( {1 - y} \right) \cdot \\ \;\;\;\;\;\;\;\left( {P{S_{{\rm{M}}1}} - P{S_{{\rm{M}}2}}} \right) \end{array} $

综合上述得

$ {f_1}\left( {x,y} \right) = \frac{{{\rm{d}}x}}{{{\rm{d}}t}} = x\left( {1 - x} \right)\left[ {y{\pi _{{\rm{E1}}}} + \left( {1 - y} \right){\pi _{{\rm{E2}}}}} \right] $

同理,可得

$ \begin{array}{l} {f_2}\left( {x,y} \right) = \frac{{{\rm{d}}y}}{{{\rm{d}}t}} = y\left( {1 - y} \right)\left[ {x{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M2}}}} + } \right.\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\left. {\left( {1 - x} \right){\pi _{{\rm{M3}}}}} \right] \end{array} $
2.1 EOL处置中心群体的演化分析

通过复制动态方程的方法来描述EOL处置中心群体策略选择的演化过程,可以得到演化过程的均衡点和演化稳定策略(ESS).根据微分方程的“稳定性定理”,若均衡点为演化稳定策略,应满足$\frac{{\partial {f_1}(x,y)}}{{\partial x}}$ < 0.对f1(x, y)求x偏导数可得

$ \frac{{\partial {f_1}\left( {x,y} \right)}}{{\partial x}} = \left( {1 - 2x} \right)\left[ {y\left( {{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}} \right) + {\pi _{{\rm{E2}}}}} \right] $

根据上式可分析以下3种情况:

(1) 当y < $\frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}},{\left. {\frac{{\partial {f_1}(x,y)}}{{\partial x}}} \right|_{x = 0}}$ < 0,${\left. {\frac{{\partial {f_1}(x,y)}}{{\partial x}}} \right|_{x = 1}} > 0$,根据微分方程的“稳定性定理”,若均衡点为ESS,应满足${\frac{{\partial {f_1}(x,y)}}{{\partial x}}}$ < 0,满足该条件,所以x=0是EOL处置中心群体策略选择的ESS,即为演化稳定策略.

(2) 当$y = \frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}},\frac{{{\rm{d}}y}}{{{\rm{d}}t}} = 0$,所有x水平上的点都是稳定状态,该种情况说明EOL处置中心没有学习模仿过程,不存在演化过程和ESS,因而不存在演化稳定策略.

(3) 当$y > \frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}},{\left. {\frac{{\partial {f_1}(x,y)}}{{\partial x}}} \right|_{x = 0}} > 0,{\left. {\frac{{\partial {f_1}(x,y)}}{{\partial x}}} \right|_{x = 1}} < 0$,根据微分方程的“稳定性定理”,若均衡点为ESS,应满足${\frac{{\partial {f_1}(x,y)}}{{\partial x}}}$>0,满足该条件,所以x=1是EOL处置中心群体策略选择的ESS,即为演化稳定策略.

根据以上EOL处置中心群体的3种情况下选择回收策略的动态趋势及稳定性,如图 3所示.

图 3 EOL处置中心群体的复制动态相位图 Fig.3 The replication dynamic phase graph of the EOL products disposal center group

图 3中,可以看出,当$y < \frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}}$时,EOL处置中心群体逐渐趋向于选择不回收EOL产品策略.当OEM群体的初始状态中采取再利用EOL产品策略的比例$y = \frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}}$时,EOL处置中心群体中采取回收EOL产品策略的个体的比例将保持不变,此时不存在ESS,即不存在演化稳定性策略.而当$y > \frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}}$时,EOL处置中心群体逐渐趋向于选择回收EOL产品策略,这有利于促进再利用.其中$\frac{{ - {\pi _{{\rm{E2}}}}}}{{{\pi _{{\rm{E1}}}} - {\pi _{{\rm{E2}}}}}} = \frac{{{c_{\rm{t}}} - {p_{{\rm{m2}}}}(1 - \alpha )}}{{\alpha {p_{{\rm{m1}}}}}}$.

2.2 OEM群体的演化分析

如前文所述,通过复制动态方程的方法来描述OEM群体策略选择的演化过程,可以得到演化过程的均衡点和演化稳定策略(ESS).根据微分方程的“稳定性定性原理”,若均衡点为ESS,应满足$\frac{{\partial {f_2}(x,y)}}{{\partial y}}$ < 0.对f2(x, y)求y偏导数可得

$ \frac{{\partial {f_2}\left( {x,y} \right)}}{{\partial y}} = \left( {1 - 2y} \right)\left[ {x\left( {{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M2}}}}} \right) + {\pi _{{\rm{M3}}}} - {\pi _{{\rm{M2}}}}} \right] $

同理,根据上式可分析以下4种情况:

(1) 当$x < \frac{{{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}}}{{{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}}}$,且πM1>πM2>πM3,根据微分方程的“稳定性定理”,若均衡点为ESS,应满足$\frac{{\partial {f_2}(x,y)}}{{\partial y}}$ < 0,满足该条件,所以y=0是OEM群体策略选择的ESS,即为演化稳定策略.

(2) 当x=$\frac{{{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}}}{{{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}}}$πM1>πM2>πM3,则$\frac{{{\rm{d}}y}}{{{\rm{d}}t}} = 0$,所有y水平上的点都是稳定状态,该种情况说明OEM没有学习模仿过程,不存在演化过程和ESS,因而不存在演化稳定策略.

(3) 当x>$\frac{{{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}}}{{{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}}}$πM1>πM2>πM3,根据微分方程的“稳定性定理”,若均衡点为ESS,应满足$\frac{{\partial {f_2}(x,y)}}{{\partial y}}$ < 0,满足该条件,所以y=1是OEM群体策略选择的ESS,即为演化稳定策略.

(4) 当πM3>πM2,无论x在0—1之间取什么值,0.5 < y < 1水平上的点都是稳定状态.根据微分方程的“稳定性定理”,若均衡点为ESS,应满足$\frac{{\partial {f_2}(x,y)}}{{\partial y}}$ < 0,满足该条件,所以y=1是OEM群体策略选择的ESS,即为演化稳定策略.但是当πM3>πM2发生时,政府监管系数应满足m>pm1+ct/α-s,说明政府的监督力度非常大,成本很高.政府需要花费很多人力物力资源,来对OEM再利用进行监管,此时OEM在市场利润驱动下肯定选择再利用,而且生产越多,它的利润就越大.但是对政府来说,会加重财政负担,所以这种情况很难发生.

根据以上OEM群体的4种情况,选择再利用策略的动态趋势及稳定性如图 4所示.

图 4 OEM群体的复制动态相位图 Fig.4 The replication dynamic phase graph of the OEM group

图 4中,可以看出,当EOL处置中心群体的初始状态为没有任何人采取回收EOL产品策略时,此时不存在ESS.当EOL处置中心群体中有个体的初始状态为采取回收EOL产品策略,如果OEM采取再利用策略的利润小于其采取生产新产品策略的利润时,则OEM群体逐渐趋向于选择生产新产品策略.如果OEM采取再利用策略的利润大于其采取再利用策略的利润,则OEM群体逐渐趋向于选择再利用策略.

将上述EOL处置中心群体与OEM群体的复制动态趋势绘在同一个坐标平面中,如图 5所示.

图 5 EOL处置中心群体与OEM群体演化趋势图 Fig.5 The evolution graph of EOL products disposal center and OEM groups

图 5中可以看出,当OEM选择再利用策略时的利润小于其选择不再利用策略时的利润,该博弈逐渐收敛于均衡点(0,0),由于形不成买方市场,则EOL处置中心群体逐渐趋向于选择不回收EOL产品策略,OEM群体逐渐趋向于选择不再利用策略,(不回收,不再利用)将是EOL处置中心与OEM两个群体的唯一选择.而当OEM选择再利用策略时的利润大于其选择不再利用策略时的利润,该博弈逐渐收敛于均衡点(1,1),即EOL处置中心群体逐渐趋向于选择回收EOL产品策略,OEM群体逐渐趋向于选择再利用策略,(回收,再利用)将是EOL处置中心与OEM两个群体的唯一选择.通过以上分析,可以看出,EOL处置中心群体与OEM群体的ESS均取决于OEM的利润.不难得出结论如下:

如果x>$\frac{{{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}}}{{{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}}}$>,且πM1>πM2>πM3,即pN>pR>pN-s-m,均衡点(1,1) 是OEM和EOL处置中心唯一的演化均衡策略(ESS).

研究结论表明,如果想要使(回收,再利用)策略成为EOL处置中心与OEM唯一的策略选择时,需要使得再利用的单价满足条件pR>pN-s-m,但是这样会提升再制品的销售价格,容易使得产品的销量下降.这时就需要想办法降低OEM在再利用及降低EOL处置中心对EOL产品处理过程中的单位修复成本,加大技术创新,提高EOL产品可利用率,提高系统的生产效率,提升再制品的市场竞争能力,促进产业发展水平.在现实情境中,LCV-HEI类EOL产品的回收,政府更应该合理补贴积极创造条件鼓励EOL处置中心与OEM群体向社会福利最大化方向演进.

2.3 政府激励影响下的演化分析

资源再利用产业是国家鼓励的战略新兴产业,目前还处于发展阶段,受技术、环境等因素的限制,会出现再利用成本高于生产新产品成本,导致OEM利润下降,此时就需要政府出台相关政策来保护并激励(奖罚和补贴)整个行业的发展.如前所述,下面进一步分析政府激励对EOL处置中心和OEM群体演化的影响情况.

一般来说,政府对EOL处置中心的补贴机制是按处理后EOL产品经过OEM生产再制品的数量实施补贴,如果EOL处置中心回收处理后的EOL产品没有被内循环或者外循环的OEM生产成再制品(使用掉),则没有补贴.当EOL处置中心选择不回收EOL产品时,但是OEM为了避免政府的监管惩罚,而选择自行回收EOL产品,并再利用,此时政府的回收补贴直接给OEM,根据EOL产品回收数量进行补贴,超出政府监管标准αt0部分还有额外的奖励.政府的补贴政策,将会使EOL处置中心利润相应增加,此时,OEM需要增加生产再制品的产量,才会减少消化原材料生产新产品,只有再制品与新产品同质价低,再制品消费市场才会形成良性互动.

根据模型的设定条件,政府为了促进循环经济产业的发展,根据OEM再制造的行为进行监督,当OEM生产再制品数量超过监督标准αt0,超出部分的再制品将进行奖励,每个单位奖励额度为m;对EOL产品的回收主体进行补贴,每单位的补贴额度为λ.

此时OEM采取再利用策略,且补贴前的关系为πM1>πM2, πM3,补贴后,πM1, πM2的利润不变,πM3的利润变为

$ \begin{array}{*{20}{c}} {{{\pi '}_{{\rm{M3}}}} = \left( {{p_{\rm{N}}} - {c_{\rm{m}}}} \right)\left( {Q - \alpha {t_0}} \right) + \left( {{p_{\rm{R}}} - {c_{\rm{r}}}} \right)\left( {\alpha {t_0}} \right) - }\\ {{c_{\rm{t}}}{t_0} + m\left( {\alpha {t_0} - \alpha {t_0}} \right) + \lambda \left( {\alpha {t_0}} \right)} \end{array} $

对于市场机制下EOL处置中心与OEM的演化博弈模型来说,不同的补贴额度对演化进程和演化稳定策略将产生不同的影响.以下分3种情况进行讨论:

(1) 如果补贴的额度不够,使得补贴后OEM选择再利用策略的利润仍小于其选择生产新产品策略的利润,即

$ \begin{array}{l} {\pi _{{\rm{M3}}}} - {\pi _{{\rm{M2}}}} < {{\pi '}_{{\rm{M3}}}} - {\pi _{{\rm{M2}}}} < 0,\lambda < {p_{\rm{N}}} - {p_{\rm{R}}} - {c_{\rm{m}}} - m + \\ {c_{\rm{r}}} + {C_t}/d\left| {y\left( {1 - y} \right)} \right.\left[ {x\left( {{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}} \right)} \right] < \\ y\left( {1 - y} \right)\left[ {x\left( {{\pi _{{\rm{M1}}}} - {{\pi '}_{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {{\pi '}_{{\rm{M3}}}}} \right)} \right] < 0\\ \frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{\pi _{{\rm{M3}}}}}} \right. < \frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{{\pi '}_{{\rm{M3}}}}}} \right. < 0 \end{array} $

尽管OEM群体的演化速度变慢,但还是朝着均衡点y=0收敛,双方博弈最终还是会收敛于(0, 0),而演化均衡策略(ESS)并没有变化.

(2) 如果补贴给EOL处置中心的额度需要超过EOL处置中心对OEM的让利,则OEM选择再利用策略的利润要大于其选择生产新产品策略的利润,EOL处置中心与OEM才会形成良性互动机制.即πM3-πM2 < 0 < πM3-πM2,则πM3>πM2,可求得政府单位补贴λ最小值,即

Min λ=pN-pR-cm-m+cr+ct/a

当政府对使用EOL处置品的单位补贴λ满足条件λ>pN-pR-cm-m+cr+ct/α,则有

$ \begin{array}{*{20}{c}} {y\left( {1 - y} \right)\left[ {x\left( {{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}} \right)} \right] < 0 < }\\ {y\left( {1 - y} \right)\left[ {x\left( {{\pi _{{\rm{M1}}}} - {{\pi '}_{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {{\pi '}_{{\rm{M3}}}}} \right)} \right]}\\ {\frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{\pi _{{\rm{M3}}}}}} \right. < 0 < \frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{{\pi '}_{{\rm{M3}}}}}} \right.} \end{array} $

由此可知,OEM群体的演化方向发生改变,朝着均衡点y=1收敛,双方群体博弈最终收敛于(1,1),演化稳定策略(ESS)发生改变.

(3) 如果OEM再利用就可以实现比生产新产品盈利,此时政府仍进行补贴,即:πM3-πM2>πM3-πM2>0,则有

$ \begin{array}{*{20}{c}} {0 < \left[ {x\left( {{\pi _{{\rm{M1}}}} - {\pi _{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {\pi _{{\rm{M3}}}}} \right)} \right] < y\left( {1 - } \right.}\\ {\left. y \right)\left[ {x\left( {{\pi _{{\rm{M1}}}} - {{\pi '}_{{\rm{M3}}}}} \right) - \left( {{\pi _{{\rm{M2}}}} - {{\pi '}_{{\rm{M3}}}}} \right)} \right]}\\ {\frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{{\pi '}_{{\rm{M3}}}}}} \right. > \frac{{{\rm{d}}y}}{{{\rm{d}}x}}\left| {_{{\pi _{{\rm{M3}}}}}} \right. > 0} \end{array} $

可见,OEM群体的演化速度加快,朝着均衡点y=1收敛,博弈最终收敛于(1,1),演化稳定策略(ESS)没有发生改变.

πM3>πM2,无论x在0—1之间取什么值,0.5 < y < 1水平上的点都是稳定状态,博弈最终收敛于(1,1).但是当πM3>πM2发生时,再制品价满足pR < pN,且pR>pN-s-m+pm1+ct/α,说明再制品的价格非常高,非常接近新产品价格,才能使得再利用的利润比不再利用的总利润更大;政府监管系数应满足m>pm1-s+ct/α,说明政府的监督力度非常大,成本很高.此时政府需要花费很多人力物力资源来对OEM再利用进行监管.在利润驱动下,OEM肯定选择再利用,而且生产越多,利润就越大,政府达到监管的目的.因此在理性决策下,政府不会对EOL处置中心回收进行补贴,但是这样会损害EOL处置中心的利益.所以政府通常不会选择高监管费用,而是选择合适的监管和补贴,激励EOL处置中心的回收,同时监管OEM再利用.

研究结果表明,在政府监管水平适当的情况下,0 < m < pm1-s+ct/α,当OEM选择再利用策略的利润小于其选择生产新产品策略的利润时,在政府补贴政策下,如果单位补贴λ满足以下条件,即λ>pN-pR-cm-m+cr+ct/α时,ESS存在且唯一均衡点(1,1) 是复制动态方程唯一的ESS.当OEM选择再利用策略的利润大于其选择生产新产品策略的利润时,政府补贴策略将加快复制动态向均衡点(1,1) 演化的速度.这意味着所有的策略组合都将朝着一个方向演化,OEM将逐渐倾向于选择再利用策略,EOL处置中心逐渐倾向于选择回收EOL产品策略.

3 结论

本文通过研究闭环供应链的关键环节EOL产品的回收处置、OEM利用EOL处置品生产再制品的长期演化趋势,分析了两个群体的演化稳定策略,结论如下:

(1) 需要将OEM再制品价格pR控制在合理区间.即满足pR < pN,且pR>pN-s-m.此时,采用(回收,再利用)策略成为EOL处置中心与OEM群体的唯一策略,这更有利于促进EOL产品的回收及OEM再利用.但如果再制品的单价超过新产品单价,则不利于再制品市场的形成.因此,应将pR控制在这一合理区间,以促进循环经济产业健康发展.

该结论表明,在LCV-HEI类EOL产品闭环供应链中,EOL产品的回收处置到再利用,EOL处置中心和OEM这两个群体在政府激励这一外生变量作用下,从一个外生市场环境到一个行为策略环境下,EOL处置中心给定的行为策略的适应性取决于OEM的行为策略,即回收回来的EOL产品能否会被再利用.作为闭环供应链相关主体不管是OEM,还是EOL处置中心都需要加大研发力度,降低利用EOL处置品的生产成本,控制再制品的定价,实施科学的定价机制.

(2) OEM选择再利用策略,不管利润如何,政府补贴λ满足一定条件,都可以促进群体演化形成唯一均衡点(1,1).此时,单位产品补贴λ需满足λ>pN-pR-cm-m+cr+ct/α.这意味着所有的策略组合都将朝着一个方向演化,OEM群体将逐渐倾向于选择再利用策略,EOL处置中心群体逐渐倾向于选择回收策略,且政府的激励加快了这一演化进程.

该结论表明,当EOL处置中心选择不回收策略时,在政府EPR环境规制作用下,OEM为了规避政府惩罚,被迫选择自行回收再利用.这是符合现实情景的,一般情况下,OEM会通过业务外包、委托代理等形式选择效率更高的独立再制造商(IR)或类似于本文的EOL处置中心等第三方机构专业回收EOL产品.可见在回收处置环节闭环供应链各方群体演化选择的策略与代表的利益均不相同,双方群体的博弈是在一个具有不确定的有限理性的空间进行的,博弈均衡存在双重约束,彼此的策略相互影响.但政府激励机制加快了EOL处置中心和OEM双方群体共同选择(回收,再利用)策略的演化进程.

综上所述,政府应该出台相关政策来保护并激励各环境责任主体选择集体理性的策略,确定再制品最优补贴政策,资源配置应该依靠市场价格机制来决定,以达到帕累托最优,促进整个行业的发展.

参考文献
[1] 高红贵. 中国绿色经济发展中的诸方博弈研究[J]. 中国人口·资源与环境, 2012, 22(4): 13
GAO Honggui. The multi-game research on green economic development in china[J]. China Population Resources and Environment, 2012, 22(4): 13
[2] 杨玉香, 张宝友, 孟丽君, 等. 基于环境责任的闭环供应链网络多准则决策均衡问题[J]. 系统管理学报, 2014, 23(1): 13
YANG Yuxiang, ZHANG Baoyou, MENG Lijun, et al. Equilibrium problem of multi-criteria decision-making in closed-loop supply chain network considering environmental responsibility[J]. Journal of Systems & Management, 2014, 23(1): 13
[3] 周云海, 杜纲, 安彤. 政府干涉下闭环供应链的协调机制研究[J]. 西安电子科技学大学学报, 2013, 23(5): 20
ZHOU Haiyun, DU Gang and AN Tong. Coordination mechanism of closed-loop supply chain under government intervention[J]. Journal of Xidian University, 2013, 23(5): 20
[4] ASHKAN Hafezalkotob. Competition of two green and regular supply chains under environmental protection and revenue seeking policies of government[J]. Computers & Industrial Engineering, 2015, 82: 103
[5] NATHAN W, Kannan P K and SHAPOUR A. Retail channel structure impact on strategic engineering product design[J]. Management Science, 2011, 57(5): 897 DOI:10.1287/mnsc.1110.1326
[6] HONG I and KE J S. Determining advanced recycling fees and subsidies in E-scrap reverse supply chains[J]. Journal of Environmental Management, 2011(6): 1495
[7] 李新然, 胡鹏旭, 牟宗玉. 第三方回收闭环供应链协调应对突发事件研究[J]. 利研管理, 2013, 34(1): 99
LI Xinran, HU Pengxu and MU Zongyu. The closed loop supply chain recycling by third party coordinative replying unexpected accident[J]. Science Research Management, 2013, 34(1): 99
[8] 韩小花, 薛声家. 竞争的闭环供应链回收渠道的演化博弈决策[J]. 计算机集成制造系统, 2010, 16(7): 1487
HAN Xiaohua and XUE Shengjia. Reverse channel decision for competition closed-loop supply chain based on evolutionary game[J]. Computer Integrated Manufacturing Systems, 2010, 16(7): 1487
[9] SHEU J B. Bargaining framework for competitive green supply chains under governmental financial intervention[J]. Transportation Research Part E:Logistics and Transportation Review, 2011, 47(5): 573 DOI:10.1016/j.tre.2010.12.006
[10] 郭华军, 李帮义, 倪明. 双寡头再制造进入决策的演化博弈分析[J]. 系统工程理论与实践, 2013, 33(2): 370
GUO Huajun, LI Bangyi and NI Ming. Evolutionary game analysis of duopoly's remanufacturing entry decision[J]. Systems Engineering—Theory & Practice, 2013, 33(2): 370 DOI:10.12011/1000-6788(2013)2-370
[11] 何丽红, 王秀. 低碳供应链中政府与核心企业进化博弈模型[J]. 中国人口·资源与环境, 2014, 24(3): 27
HE Lihong and WANG Xiu. An evolutionary model between governments and core enterprises in low-carbon supply chain[J]. China Population Resources and Environment, 2014, 24(3): 27
[12] 谭娟. 政府环境规制对低碳经济发展的影响及其实证研究[D]. 长沙: 湖南大学, 2012.
TAN Juan.The research on the impact of government environment regulation on development of low-carbon economy[D].Changsha:Hunan University, 2012.
[13] 黄宗盛, 聂佳佳, 胡培. 基于微分对策的再制造闭环供应链回收渠道选择策略[J]. 管理工程学报, 2013, 27(3): 93
HUANG Zongsheng, NIE Jiajia and HU Pei. Dynamic closed-Loop supply chain models with product remanufacturing[J]. Journal of Industrial Engineering and Engineering Management, 2013, 27(3): 93
[14] CHEN Jing and PETER C. Bell.Coordinating a decentralized supply chain with customer returns and price-dependent stochastic demand using a buyback policy[J]. European Journal of Operational Research, 2011, 212(2): 293 DOI:10.1016/j.ejor.2011.01.036
[15] 朱庆华, 窦一杰. 基于政府补贴分析的绿色供应链管理博弈模型[J]. 管理科学学报, 2011, 14(6): 86
ZHU Qinghua and DOU Yijie. A game model for green supply chain management based on government subsidies[J]. Journal of Management Sciences in China, 2011, 14(6): 86
[16] DONG H Z and SONG H L. Research on duplication dynamics and evolutionary stable of reverse supply chain[J]. Physics Procedia, 2012, 24(Part A): 705
[17] 杜玮浩. 再制造闭环供应链的经济与环境效益研究[D]. 北京: 北京化工大学, 2013.
DU Weihao.Research on economic and environmental benefits of remanufacturing closed-loop supply chain[D].Beijing:Beijing University of Chemical Technology, 2013.