首页 理论教育提高软件可靠性和可用性的方法

提高软件可靠性和可用性的方法

【摘要】:在不可用时间期间,用作性能评估的性能事件数的统计应被禁止。影响系统的可靠性与可用性的因素很多,主要有:设备性能恶化或故障,传输链路性能恶化或故障,干扰、环境和基础设施的影响,人为事故与维护修复时间等。

为了保证系统的有效性和良好的可维护性,在系统设计时,应首先明确系统总的可靠性可用性指标,从而对各个部分的可靠性和可用性提出要求;或者在已知各部分的可靠性与可用性要求时,估算系统总的可靠性与可用性是否达到要求。

(1)可靠性

可靠性(R)是指产品在规定的条件下和时间内,完成规定功能的能力,常用故障率(λ)来表示,即

式中λ表示产品在单位时间里发生失效的概率,常用10-9/h作为基准单位,称为菲特(fit),即在109 h内出现一次故障的可能性。

(2)可用性

可用性(A)是指产品在规定的条件下和时间内处于良好工作状态的概率,其表示式为

对于一个单向通道而言,当接收端检测到10个连续的SES事件时,不可用时间开始,这10秒算作不可用时间的部分。当接收端检测到10个连续的非SES事件时,一个新的可用时间期开始,这10秒算作可用时间的部分。在不可用时间期间,用作性能评估的性能事件数的统计应被禁止。误码性能参数的评价只有在通道处于可用状态时才有意义。

对于一个双向通道而言,只要两个方向中有一个方向处于不可用,该双向通道即为不可用。在不可用期间,两个方向用作性能评估的性能事件数的统计都应被禁止。在实际工程中,往往采用式(8-11)作为可用性的评价:

式(8-11)中,MTBF称为平均故障间隔时间,指相邻两次故障的间隔时间;MTTR 称为平均故障修复时间,指每次排除故障所需的平均时间。

影响系统的可靠性与可用性的因素很多,主要有:设备性能恶化或故障,传输链路性能恶化或故障,干扰、环境和基础设施的影响,人为事故与维护修复时间等。