摘要:一般来说,状态空间法是最适合分析系统可用性的方法。这种方法具体来说就是先选取一个系统,将它拆分为几个组件集合,然后为每个组件集合指定不同的状态,再根据系统的结构,分析这些状态是否可能影响或不影响系统的可用性,然后用一个结点表示每个状态 |
一般来说,状态空间法是最适合分析系统可用性的方法。这种方法具体来说就是先选取一个系统,将它拆分为几个组件集合,然后为每个组件集合指定不同的状态,再根据系统的结构,分析这些状态是否可能影响或不影响系统的可用性,然后用一个结点表示每个状态。例如,我们假定系统有某些功能的输入和输出,它可能是电力、制冷或者信息,所有这些都是可变的,如图3-10所示。
图3-11所示为系统的状态空间图。在图3-11中,左边的状态(状态1)常称为运行状态,右边的状态(状态2)常称为故障状态。此图实际上可以代表任何系统。它可以描述一个组件,例如电阻器或电容器,也可以描述整个系统,例如一台UPS、一辆汽车或者飞机。使用的集合程度将取决于要分析的问题。在该图中,λ1是失效率,根据公式(3-10)可知,λ1=1/MTBF1。它确定了系统在一个确定的时间内从可用状态变为不可用状态的概率。
如果系统可维修,则有一个返回路径,根据公式(3-15)μ1=1/MTTR1。该路径决定系统在已确定的单位时间内的修复速度,并使系统返回可用状态,如图3-12所示。
该系统还可以用文氏图来表示,如图3-13所示。在文氏图中,用长方形代表全集,用圆代表特定的子集。考察可用性时,全集可以代表整个时间区间。具体的事件可能导致该时间区间内的某些时间段内不可用。这些事件之外的时间段就是可用时间段。
在图3-13中,整个的长方形代表整个时间区间;A代表系统的可用时间;A代表系统的不可用时间,因此A和A的并集就是整个时间区间。
将λ=1/mtbf和μ=1/MTTR代入公式3-23中,得:
如果λ(故障率)是0.01,μ(修复率)是0.2,则可用性近似有0.95或95%。由于μ通常远远大于无在更复杂的推导中几的范围可以给出绝对或近似结果。直观地说,这一结果是基于这样一个事实:系统应很少发生故障,而且出现故障后应能相对迅速地得到修复。例如,一台UPS平均每年出现一次故障,MTBF=8765h,λ=0.000114,修复UPS平均只需要一天,MTTR=24h,则μ=0.041666,因此μ比λ大365倍。
责任编辑:handsome