制造系统需要将设备保持在良好的工作状态以防止设备故障,合理的设备维护作为典型的制造业生产性服务[1]对于保证生产线高效运行具有至关重要的作用[2].基于状态的维护(condition-based maintenance, CBM)是一种根据设备退化程度进行维护的决策方式,及时运用CBM方法辅助生产决策可以降低故障频率,减少维修费用.但由于进行CBM需要暂时停止设备运行,所以会在一定程度上影响系统产量[3].CBM引起的设备停机对于生产线的影响不仅仅单独作用于维护设备,还会引起其上游设备的阻塞或下游设备的饥饿,进而影响生产系统的整体效率,延误既定的生产进程.因此,如何平衡设备故障导致的潜在风险和停机维护引起的产量损失,在恰当的时间对设备进行维护,是每个生产系统不容忽视的问题.
在制造系统中,利用缓冲区库存可以有效减少设备维护带来的生产损失,保证维护设备在停机时其上、下游工序可以继续生产[4].作为学术和工业界关注的焦点,国内外学者不断对带缓冲区库存的生产系统的维护决策问题提出各种分析和解决方法,旨在提高系统的生产率.对于双机生产线,Karamatsoukis等[5]证明了根据系统状态控制维护决策的合理性.Gan等[6]对具有衰退特征的设备生产线建立基于马尔可夫链的数学模型,加上对备件库存量的考虑,确定上游设备的最佳维护周期.陆志强等[7]针对可修复设备,同时对单位时间成本和系统可用度进行双目标优化.对于上下游设备同时退化的双机生产线,Fitouhi等[8]以提高系统整体生产效率为目标,计算了最佳维护点,并证明了设备运行速度对维护决策的影响.对于多机复杂系统,Nahas[9]在产量约束的前提下综合考虑维护活动对系统的整体影响,通过合理分配各缓冲区的容量,确定最优预防性维护策略.周炳海等[10]通过建立系统状态与质量损失间的函数关系,确定机会维护决策点.面对维护后不能完全恢复如新的设备,Zhang等[11]研究了故障设备数量与维护决策之间的关系.
上述文献在计算维护活动造成的生产损失时,往往假设系统损失的产量与设备停机时间成正比.然而由于复杂生产系统中设备和缓冲区的交互作用[12],并非所有的停机时间都会对系统造成永久性的生产损失,部分停机时间只会导致产量临时降低,并在后续的生产活动中得以恢复[13].对于机器可靠性服从伯努利分布的生产线,Chang等[14]验证了通过计算停机维护造成的生产损失,可以量化维护活动对系统产生的影响.Li等[15]建立了基于事件的模型来量化设备活动对生产系统的影响.上述文献通过可检测到的生产数据评估了停机活动对系统产生的影响并寻求改进,但无法预测系统后期的动态变化并提前做出准备.
综上所述,目前很少有文献在准确描述系统动态的基础上预测设备停机对系统带来的影响.因此,研究设备符合伯努利可靠性模型的生产线[16](伯努利生产线)实时维护决策问题,建立基于马尔可夫过程的数学模型描述系统的实时动态变化,预测维护活动对系统带来的潜在影响,使系统在一系列的停机维护过程中永久性生产损失最小,并通过仿真实验,验证模型和算法的有效性.
1 问题描述考虑一条如图 1所示的具有M台设备、M-1个缓冲区的串行伯努利生产系统.Mm表示第m个设备,bm表示第m个缓冲区.该系统的符号和假设如下:
(1) 缓冲区bm, m=1, …, M-1的容量上限为Bm.
(2) 设备Mm, m=1, …, M的生产周期相同,系统按照机器生产周期划分为生产阶段t=1, …, T.
(3) 系统中所有设备均为可靠性为pm的伯努利设备,即在阶段t,设备Mm运行的概率为pm,失效的概率为1-pm.
(4) αm表示设备Mm的状态.
$ {\alpha _m} = \left\{ {\begin{array}{*{20}{l}} {0,}&{{M_m}{\rm{不运行}}}\\ {1,}&{{M_m}{\rm{运行}}} \end{array}} \right. $ | (1) |
(5) 设备Mm的最大速度为Sm,即在运行过程中,设备Mm的时速不超过Sm.
(6) 如果设备Mm*的加工速度最小,即MM*=arg minm=1, …, M(Sm),则设备Mm*称为最慢设备.
(7) 当系统满足以下条件时,Mm阻塞:①Mm运行; ②下游缓冲区容量bm(t)=Bm; ③Mm+1不运行.
(8) 当系统满足以下条件时,Mm饥饿:①Mm运行; ②上游缓冲区容量bm-1(t)=0.
(9) M1永远不会饥饿,MM永远不会阻塞.
(10) ei=(Mm, ti, di)表示发生在设备Mm的停机事件,停机时间为[ti, ti+di).
1.1 基于马尔可夫过程的系统动态描述用马尔可夫过程模型来描述生产系统的动态变化.在生产阶段t,系统状态U(t)可以用M-1个缓冲区的容量来表示,即
$ \gamma = \sum\limits_{m = 1}^M {{b_m}{\theta _{m + 1}}} $ | (2) |
其中
$ {b_m}\left( t \right) = {b_m}\left( t \right) + {s_m}\left( t \right) - {s_{m + 1}}\left( t \right),m = 1, \cdots ,M - 1 $ | (3) |
其中,设备Mm在阶段t的生产速度为
$ {s_m}\left( t \right) = \left\{ \begin{array}{l} \min \left\{ {{S_m}{\alpha _m}\left( t \right),{B_m} - {b_m}\left( {t - 1} \right) + } \right.\\ \;\;\;\;\left. {{s_{m + 1}}\left( t \right)} \right\},m = 1\\ \min \left\{ {{S_m}{\alpha _m}\left( t \right),{b_{m - 1}}\left( {t - 1} \right)} \right\},\;\;\;m = M\\ \min \left\{ {{S_m}{\alpha _m}\left( t \right),{b_{m - 1}}\left( {t - 1} \right),} \right.\\ \;\;\;\;{B_m} - {b_m}\left( {t - 1} \right) + \left. {{s_{m + 1}}\left( t \right)} \right\},\\ \;\;\;\;\;\;\;\;\;\;\;m = 2, \cdots ,M - 1 \end{array} \right. $ | (4) |
在阶段t,生产系统的设备状态共有2M种组合方式,每种组合方式分别对应了不同的缓冲区容量变化情况.假设系统在阶段t的状态为
步骤1 计算阶段t设备状态α1(t), α2(t), …, αM(t)的组合概率
$ P\left( {{\alpha _1},{\alpha _2}, \cdots ,{\alpha _M}} \right) = \prod\limits_{m = 1}^M {p_m^{{\alpha _M}}{{\left( {1 - {p_m}} \right)}^{1 - {\alpha _M}}}} $ | (5) |
步骤2 假设在阶段t,系统状态
步骤3 将对应了相同的系统状态的设备状态组合概率相加,即得到系统从U(t)变成U(t+1)的转移概率.
步骤4 对所有系统状态重复以上步骤,直到得到系统状态转移矩阵A.
通过以上步骤,当给定系统初始状态Psys(0)时,任一生产阶段的系统状态可以由式(6)迭代得到
$ {P_{{\rm{sys}}}}\left( {t + 1} \right) = \mathit{\boldsymbol{A}}{P_{{\rm{sys}}}}\left( t \right) $ | (6) |
Li等[16]提出,机会窗口是指事件
$ {W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right) = \left\{ \begin{array}{l} {\rm{inf}}\left\{ {d:{b_m}\left( {{t_i} + d} \right) = } \right. \cdots = \\ \;\;\;\;\left. {{b_{{M^*} - 1}}\left( {{t_i} + d} \right) = 0,0 \le d \le {d_i}} \right\},\\ \;\;\;1 \le m \le {M^*}\\ 0,\;\;\;\;\;n = {M^*}\\ {\rm{inf}}\left\{ {d:{b_{{M^*}}}\left( {{t_i} + d} \right) = {B_{{M^*}}}} \right. \cdots \\ \;\;\;\;\left. {{b_{m - 1}}\left( {{t_i} + d} \right) = {B_{m - 1}},0 \le d \le {d_i}} \right\},\\ \;\;\;{M^*} \le m \le M \end{array} \right. $ | (7) |
从式(7)可以看出,机会窗口的定义与停机设备在生产线的相对位置有关.当Mm位于MM*上游(1 < m < MM*)时,Wm(ei)表示设备Mm和MM*之间的缓冲区容量变为零的最短时间,当Mm位于MM*下游(MM* < m < Mm)时,Wm(ei)表示设备Mm和MM*之间的缓冲区容量达到上限的最短时间.也就是说,Wm(ei)是指从Mm停机开始到最慢设备MM*进入阻塞或饥饿状态的时间.
根据机会窗口的定义,通过分析MM*在停机过程[ti, ti+di)中的状态变化,找出其饥饿或阻塞的时间点,可以准确量化停机维护对系统产量的影响.因此,发生在Mm的停机事件ei=(Mm, ti, di)对系统造成的永久性生产损失L(ei)则可以通过最慢设备MM*在系统停机时间里的产生的生产损失来衡量.
$ L\left( {{\mathit{\boldsymbol{e}}_i}} \right) = \left\{ {\begin{array}{*{20}{l}} {{{\bar S}_{{M^*}}}\left( {{d_i} - {W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right)} \right),}&{{d_i} > {W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right)}\\ {0,}&{{d_i} > {W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right)} \end{array}} \right. $ | (8) |
式中:
从机会窗口的定义可以看出,机会窗口Wm(ei)的长度与停机设备Mm和最慢设备MM*之间的缓冲区容量有关.Mm和MM*相对位置的不同,Wm(ei)呈现不同的单调性.
定理1 在服从假设(1)~(10)定义的伯努利生产线中:
(1) 如果Mm位于MM*上游,那么机会窗口Wm(ei)随着Mm和MM*间的缓冲区容量
(2) 如果Mm位于MM*下游,那么机会窗口Wm(ei)随着Mm和MM*间的缓冲区容量
证明 假设停机事件发生于最慢设备MM*的上游(1 < m < MM*).在生产阶段[ti, ti+di)中,设备Mm和MM*之间缓冲区的容量的变化Δb等于2台设备在此阶段产量的差,具体可以表示为
$ \begin{array}{l} \Delta b = \sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i} + {d_i}} \right)} - \sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i}} \right)} = \\ \;\;\;\;\;\;\;\sum\limits_{t = {t_i}}^{{t_i} + d} {{s_m}\left( t \right)} - \sum\limits_{t = {t_i}}^{{t_i} + d} {{s_{{M^*}}}} \left( t \right) \end{array} $ | (9) |
其中
$ \sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i} + {d_i}} \right)} - \sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i}} \right)} = - \sum\limits_{t = {t_i}}^{{t_i} + d} {{s_{{M^*}}}\left( t \right)} $ | (10) |
根据机会窗口的定义,要计算在不造成永久性生产损失的前提下Mm的最长停机时间,就要找到缓冲区bm到bM*-1容量全部变为零的时刻ti+di,即
$ \sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i}} \right)} = \sum\limits_{t = {t_i}}^{{t_i} + d} {{s_{{M^*}}}\left( t \right)} $ | (11) |
MM*的累计产量
$ \sum\limits_{t = {t_i}}^{{t_i} + d} {{s_{{M^*}}}\left( t \right)} \approx {{\bar S}_{{M^*}}} \cdot d $ | (12) |
其中
$ {{\bar S}_{{M^*}}} = \frac{{\int_0^T {{S_{{M^*}}}} \left( {\tau ,E} \right){\rm{d}}\tau }}{T} $ |
因此,Mm的机会窗口Wm(ei)为
$ E\left[ {{W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right)} \right] = \frac{{\sum\limits_{k = m}^{{M^*} - 1} {{b_k}\left( {{t_i}} \right)} }}{{{{\bar S}_{{M^*}}}}},1 \le m \le {M^*} $ | (13) |
从式(13)可以看出,当停机设备Mm位于最慢设备MM*的上游时,其机会窗口Wm(ei)与Mm和MM*之间的缓冲区总容量
结合系统动态描述和机会窗口的定义,可以计算出在复杂系统动态下各个设备的机会窗口,进而预测停机事件ei对系统产量的影响.假设存在停机维护ei=(Mm, ti, di),根据机会窗口的定义,为了确定Mm不造成生产损失的最长停机时间,需要找到维护设备Mm和最慢设备MM*之间缓冲区容量开始变为零(1 < m < MM*)或达到容量上限(MM* <m <Mm)的时间点.用Zm表示这2种特殊的系统状态,即
$ {Z_m} = \left\{ \begin{array}{l} {b_m}\left( t \right) = {b_{m + 1}}\left( t \right) = \cdots = {b_{{M^*} - 2}}\left( t \right) = \\ \;\;\;{b_{{M^*} - 1}}\left( t \right) = 0.1 < m < {M_{{M^*}}}\\ {b_{{M^*}}}\left( t \right) = {B_{{M^*}}},{b_{{M^*} + 1}}\left( t \right) = {B_{{M^*} + 1}}, \cdots ,\\ \;\;\;{b_{m - 2}}\left( t \right) = {B_{m - 2}},{b_{m - 1}}\left( t \right) = {B_{m - 1}},\\ \;\;\;{M_{{M^*}}} < m < {M_m} \end{array} \right. $ | (14) |
则机会窗口的定义可以简化为
$ {W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right) = \left\{ {\begin{array}{*{20}{l}} {{\rm{inf}}\left\{ {d:U\left( {{t_i} + d} \right) \in {Z_m}} \right\},}&{m \ne {M^*}}\\ {0,}&{m = {M^*}} \end{array}} \right. $ | (15) |
因此,维护活动ei=(Mm, ti, di)的机会窗口Wm(ei)可以通过以下步骤求得.
步骤1 初始化:d=0.
步骤2 根据式(5)求得系统状态在ti+d的概率分布Psys(ti+d).
步骤3 计算系统状态在阶段ti+d处于Zm的概率和
步骤4 计算机会窗口为d的概率P(Wm(ei)), 为
$ \begin{array}{l} P\left( {{W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right) = d} \right) = \sum\limits_{U\left( {{t_i} + d} \right) \in {Z_m}} {\left( {{P_{{\rm{sys}}}}\left( {{t_i} + d} \right),{t_i} + d} \right) - } \\ \;\;\;\;\;\;\;\;\;\sum\limits_{U\left( {{t_i} + d - 1} \right) \in {Z_m}} {\left( {{P_{{\rm{sys}}}}\left( {{t_i} + d - 1} \right),{t_i} + d - 1} \right)} \end{array} $ | (16) |
步骤5 判断
步骤6 d=d+1,根据式(5),确定阶段ti+d的系统转移概率并转到步骤2.
通过以上步骤可以得到机会窗口Wm(ei)的概率分布,即P(Wm(ei)=0), P(Wm(ei))=1, …,P(Wm(ei)=n).则Mm机会窗口Wm(ei)的期望可以表示为
$ E\left[ {{W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right)} \right] = \sum\limits_{d = 0}^n {d \cdot P\left( {{W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right) = d} \right)} $ | (17) |
根据上文的算法,可以计算出待维护设备Mm的机会窗口,进而量化维护活动ei对生产线造成的永久性生产损失.为了降低此损失,维护活动应尽量安排在机会窗口较长的生产阶段.因此,如何调整维护活动ei的停机时间,保证停机时Mm的机会窗口相对较长,是下一个需要解决的问题.假设每次维护的决策窗口为[0, T),即对于维护活动ei=(Mm, ti, di),其开始时间ti可以为决策窗口时间段内的任一时间点,即0≤ti < T.此时,维护活动ei的开始时间ti可以通过以下步骤求得.
步骤1 初始化:ti=0.
步骤2 根据2.1节的计算步骤,求出系统在阶段ti的机会窗口Wm(ei).
步骤3 ti=ti+1,判断ti < T,若成立,则转到步骤4;否则转到步骤5.
步骤4 根据式(5),确定阶段ti的系统转移概率并转到步骤2.
步骤5 寻找维护活动的最佳开始时间ti*,并终止计算,计算方式见式(18):
$ t_i^* = {\rm{arg}}\;{\rm{max}}E\left[ {{W_m}\left( {{\mathit{\boldsymbol{e}}_i}} \right),{t_i}} \right] $ | (18) |
如图 2,假设一条拥有4台设备和3个缓冲区的伯努利生产线,长方形表示生产机器,圆形表示缓冲区.随运行时间增加,设备M1和M3的健康状态不断退化,设备可靠性随之降低.用hi表示Mi的健康状态,从初始状态hi(0)=1不断衰减至退化状态,即0 < hi≤1.假设每次维护后hi恢复到初始值,即hi(t)=1.设备的可靠性pi(t)=1也随着状态h1的退化而降低,其中t表示距离上一次维护的时间.为了方便计算,假设设备M2和M4的健康状态和可靠性保持不变.模拟系统的主要参数如表 1、表 2,时间轴按加工周期c=10 min划分生产阶段.
实验1证明了机会窗口的单调性,即通过调整缓冲区容量,可以减少维护活动ei=(Mm, ti, di)对生产系统的影响.假设对设备M1和M3按时进行维护,其平均修复时间分别为
实验2证明了实时CBM决策控制算法的合理性,即通过预测机会窗口灵活调整维护活动的开始时间,降低生产损失.假设设备Mi(i=1, 3)有一组维护计划
策略1:在决策窗口开始时停机维护.
策略2:随机选择时间停机维护,即维护活动的开始时间为决策窗口W内任一时刻.
策略3:实时CBM决策控制方法.
图 4显示了3种策略下每次维护造成的永久性生产损失.从图 4可以看出,由于策略3可以有效缓解CBM对产量的影响,因此在该种策略下产生的损失低于前2种策略.如表 3所示,在决策窗口开始时停机维护和随机选择时间停机维护对系统造成的平均生产损失分别为19.25和17.38,而利用实时CBM决策控制方法来控制停机维护的生产损失只有10.56,相较于前2种情况,生产损失分别减少了45.14%和39.24%,有效提升了系统产量.
研究了伯努利生产线的实时维护决策问题,通过建立数学模型描述生产系统的状态变化,预测待维护设备的机会窗口,从而控制CBM决策,降低生产系统由于停机维护所导致的永久性生产损失.实验结果表明,本文的数学模型可以有效描述复杂系统的动态变化,量化停机维护对生产线带来的负面影响.而CBM控制算法对降低由维护导致的永久性生产损失有明显效果.本文目前只从生产损失角度来评估CBM对制造系统带来的影响,而在实际生产中,维护决策的实施还要考虑生产成本、维护成本和库存成本等其他方面的因素.综合考虑以上多种成本对维护决策的影响是后续工作重点.
[1] |
黄君政, 李爱平, 刘雪梅, 等. 考虑缓冲区配置的生产线布局优化设计[J]. 同济大学学报(自然科学版), 2015, 43(7): 1075 HUANG Junzheng, LI Aiping, LIU Xuemei. Optimal design of production line layout considering buffer allocation[J]. Journal of Tongji University (Natural Science), 2015, 43(7): 1075 |
[2] |
WANG H. A survey of maintenance policies of deteriorating systems[J]. European Journal of Operational Research, 2002, 139(3): 469 DOI:10.1016/S0377-2217(01)00197-7 |
[3] |
KOOCHAKI J, BOKHORST J A C, WORTMANN H, et al. Condition based maintenance in the context of opportunistic maintenance[J]. International Journal of Production Research, 2012, 50(23): 6918 DOI:10.1080/00207543.2011.636924 |
[4] |
PAVITSOS A, KYRIAKIDIS E G. Markov decision models for the optimal maintenance of a production unit with an upstream buffer[J]. Computers & Operations Research, 2009, 36(6): 1993 |
[5] |
KARAMATSOUKIS C C, KYRIAKIDIS E G. Optimal maintenance of two stochastically deteriorating machines with an intermediate buffer[J]. European Journal of Operational Research, 2010, 207(1): 297 DOI:10.1016/j.ejor.2010.04.022 |
[6] |
GAN S, ZHANG Z, ZHOU Y, et al. Joint optimization of maintenance, buffer, and spare parts for a production system[J]. Applied Mathematical Modelling, 2015, 39(19): 6032 DOI:10.1016/j.apm.2015.01.035 |
[7] |
陆志强, 王佳跃, 周炳海. 带缓冲区的可修复设备多目标预防性维护决策模型[J]. 计算机集成制造系统, 2010, 16(10): 2124 LU Zhiqiang, WANG Jiayue, ZHOU Binghai. Multi-objective preventive maintenance decision-making model for repairable equipment with buffer[J]. Computer Integrated Manufacturing Systems, 2010, 16(10): 2124 |
[8] |
FITOUHI M C, NOURELFATH M, GERSHWIN S B. Performance evaluation of a two-machine line with a finite buffer and condition-based maintenance[J]. Reliability Engineering & System Safety, 2017, 166: 61 |
[9] |
NAHAS N. Buffer allocation and preventive maintenance optimization in unreliable production lines[J]. Journal of Intelligent Manufacturing, 2017, 28(1): 1 DOI:10.1007/s10845-014-0957-9 |
[10] |
周炳海, 刘子龙. 考虑质量损失的退化系统维护建模[J]. 浙江大学学报(工学版), 2016, 50(12): 2270 ZHOU Binghai, LIU Zilong. Maintenance modeling for deteriorating system considering quality loss[J]. Journal of Zhejiang University (Engineering Science), 2016, 50(12): 2270 |
[11] |
ZHANG Y L, WANG G J. An optimal replacement policy for a multistate degenerative simple system[J]. Applied Mathematical Modelling, 2010, 34(12): 4138 DOI:10.1016/j.apm.2010.04.011 |
[12] |
ZHANG L, WANG C, ARINEZ J, et al. Transient analysis of Bernoulli serial lines: Performance evaluation and system-theoretic properties[J]. ⅡE Transactions, 2013, 45(5): 528 |
[13] |
CHANG Q, BILLER S, XIAO G, et al. Transient analysis of downtimes and bottleneck dynamics in serial manufacturing systems[J]. Journal of Manufacturing Science & Engineering, 2010, 132(5): 635 |
[14] |
CHANG Q, NI J, BANDYOPADHYAY P, et al. Maintenance opportunity planning system[J]. Journal of Manufacturing Science & Engineering, 2007, 129(3): 661 |
[15] |
LI Y, CHANG Q, NI J, et al. Event-based supervisory control for energy efficient manufacturing systems[J]. IEEE Transactions on Automation Science & Engineering, 2016, 15(1): 92 |
[16] |
LI J, Meerkov S M. Production Systems Engineering[M]. [S.l.]: Springer US, 2009.
|