电源设备可靠性的研讨
本文所研讨的可靠性问题,适用于几乎所有的电子系统和机电一体化设备。电源设备尤其是交流电源设备,作为电子系统的基础部件,长期、稳定地保持正常工作能力尤为重要。美国贝尔实验室的研究报告指出:造成计算机等精密电子设备损坏的主要原因是电压的浪涌(surge),即短期(10ms左右)或长期的过电压,占全部损坏原因的45.3%。雷击占9.4%。引起设备工作不正常和误码的主要原因是电压过低(含短期脉动)(sags)占87%,以及脉冲尖峰干扰占9%。因而,世界上许多著名的制造商均有严格的场地供电标准,责成用户予以保证。
近年来,电源设备日趋复杂,元器件的品种和数量增加很快;使用环境也变得恶劣多样;而所服务的电子系统又越来越重要和昂贵。以交流参数稳压电源为例,已广泛地应用于车载、舰载、地面的军用装备,航空航天部门,铁路和交通的信号和通信系统等方面。电源需要日夜不停地连续运行,还要经受高、低温,高湿,冲击等考验。运行中往往不允许检修,或只能从事简单的维护。这一切就使得电源设备的可靠性研究,变得刻不容缓,十分重要了。其实,早在上世纪70年代,英国电气工程师学会发表的论文就指出:在提供军事通信的英国天网系统的设计研制中,中心课题首先是可靠性!
国际上,通用的可靠性定义为:在规定环境条件下,和规定的时间内,完成规定功能的能力。此定义适用于一个系统,也适用于一台设备或一个单元。由于故障出现的随机性质,用数学方式来描述可靠性,常用“概率”来表示。
从而,引出可靠度[R(t)]的定义:系统在规定环境条件下和规定时间内,完成规定功能的概率。
例如:对N个产品进行试验,每经过Δt的时间间隔检查一次,每次出故障的产品数为ni,则在T时间内的可靠度R(t)为:R(t)=[(N-)/N],可近似为:
R(t)=(N-)/N
R(t)的数值范围为:0≤R(t)≤1。R(t)的值越接近于1,则表示可靠性越高。如系统有N个单元组成(串联方式),各单元的R(t)分别为R1(t),R2(t)……RN(t),则整个系统的RΣ(t)=R1(t)·R2(t)…RN(t)。可见,系统越复杂,可靠性越差。
1影响系统可靠性的因素
涉及系统可靠性的因素很多。目前,人们认识上的主要误区是把可靠性完全(或基本上)归结于元器件的可靠性和制造装配的工艺;忽略了系统设计对于可靠性的决定性的作用。据美国海军电子实验室的统计,整机出现故障的原因和各自所占的百分比如表1所列:
lim
Δt→0
N→∞
表1整机故障原因统计 故障原因 占总失效数的(%) 设计上的原因元器件质量上的原因操作和维护上的原因制造上的原因 40302010 在民用电子产品领域,日本的统计资料表明,可靠性问题80%源于设计方面。(日本把元器件的选型,质量级别的确定,元器件的负荷率等部分也归入设计上的原因)。总之,对系统的设计者而言,需明确建立“可靠性”这个重要概念,把系统的可靠性引为重要的技术指标,认真重视可靠性的设计工作,并采取足够的提高可靠性的措施,才能使系统和产品达到稳定、优质的目标。
2衡量系统可靠性的指标及其数学关系
21失效率λ
λ定义为:该种产品在单位时间内的故障数。即:
λ=dn/dt
相对于每一个依然正常工作的样品的失效率,
λ=(1/NS)·dn/dt
式中:NS为总试验品N,经过Δt时间以后,依然正常工作的样品数。
工程上,采用近似式。如果在一定时间间隔(t1-t2)内,试验开始时的正常工作的样品数为ns个,而经过(t1-t2)后出现的故障样品数为n个,则这一批样品中对于每一个正常样品的失效率λ为:
λ=n/[ns(t1-t2)]
失效率λ的数值越小,则表示可靠性越高。λ可以作为电子系统和整机的可靠性特征量,更经常作为元器件和接点等的可靠性特征量。其量纲为[1/h]。国际上常用[1/109h]称为[fit],作为λ的量纲。
例如,美国GE公司97F8000系列用于交流电源的金属化薄膜电容器的工作寿命为:100只电容器在工作60000h以后,95只电容器正常,5只电容器此期间有可能出现故障。则:
λ=n/〔ns(t1-t2)〕
代入ns=100,n=5,(t1-t2)=60000h,则有:
λ=0.83·10-6/h=830[fit]。
美国1974年颁布的标准工作条件下的元器件基本失效率如表2所列(供参考)。
22平均无故障工作时间MTBF
MTBF的定义为:电子系统无故障工作时间的平均值。
对于一批(N台)电子系统而言:MTBF=ti/N[h]
式中:ti—第i个电子系统的无故障工作时间[h];
N—电子系统的数量。
工程上,如一台整机,在试验时,总的试验时间为T,而出现了n次故障。出现故障进行修复,然后再进行试验(维修的时间不包括在总试验时间T内)。则:
MTBF=T/n[h]
MTBF数值越大,则表示该电子系统可靠性越高。MTBF的参考数据如表3所列:
表3MTBF的参考数据 电子系统名称 MTBF/(h) 1978年集成彩色电视接收机(国际水平) ≥2000 阿波罗宇宙飞船电子计算机 (2~2.5)×104 英国天网卫星系统 1000 美国“泰康”远程导航设备(20世纪80年代) 150 Simods数字频率合成器 10×104 还是以上述美国GE公司97F8000系列用于交流电源的金属化薄膜电容器为例:
T=60000h,100只受试电容共出现5只有故障,那么对于每只电容器来讲:
MTBF=100T/n=120×104h。
在此,必须明确不论是失效率λ,还是平均无故障工作时间MTBF,均为衡量设备或元器件可靠性的“概率”性的指标。切不可误解为对于上述电容器每只可以工作120万h以后才会出现故障。具体到某一只电容器,也可能一用就坏,更大的可能是工作60000h以后还是很正常。
23平均维修时间MTTR
MTTR的定义为:系统维修过程中,每次修复时间的平均值。即:
表2美国1974年颁布的标准工作条件下元器件失效率 元器件类型 λ(fit) 电阻器 固定薄膜 4 合成电位器 138 线绕电位器 167 电容器 纸介 70 铝电介 117 可变陶瓷 393 继电器 6 半导体二极管 硅 20 齐纳 18 半导体三极管 锗PNP 56 锗NPN 140 硅PNP 63 硅NPN 33
表4国际通信卫星系统有关R(t)参考数据 电子系统名称 R(t)/(%) 国际通信卫星Ⅲ号 地面站 99.7 天线 93.5 电源 94.2 国际通信卫星Ⅳ号转发器电子设备 连续工作2个月时 99.9 连续工作7年后 79.0 供电系统国际水平 99.95 MTTR=ti/M[h]
式中:Δti—第i次的修复时间[h]。
M—修复次数。
任何设备无论如何可靠,永远存在着维修的问题。所以MTTR总是越小越好。因而,实现方便快捷的维修或不停机维修有着重大的价值。
24有效度(可用度)A
A的定义为:电子系统使用过程中(尤其在不间断连续使用条件下)可以正常使用的时间和总时间的比例(通常以百分比来表示)。即:
A=MTBF/(MTBF+MTTR)
A值越接近于100%,表示电子系统有效工作的程度越高。
实际上,设备MTBF受到系统复杂程度,成本等多方面因素的限制,不易达到很高的数值。尽量缩短MTTR也同样可以达到增加A的目的。对于高失效率单元,采用快速由备份单元代替失效单元的冗余式设计,可以在MTBF不很高的情况,使MTTR接近于0,这样,也可以使A近于100%。
25可靠度R(t)
可靠度R(t)是衡量电子系统可靠性的最基本的指标。可从可靠度R(t)的定义中导出故障概率F(t)。即:
F(t)=1-R(t),或R(t)=1-F(t)。
可以看出,对于R(t)和F(t)来讲,其值均为时间量t的函数。极端来讲,t=0时,任何系统的R(t)=1,〔F(t)=0〕。在t=∞时,任何系统的R(t)=0,〔F(t)=1〕。R(t)和F(t)只有在指定的时间范围以内才有具体的意义。在实际使用中常用年可靠度P来表示。
年可靠度P的定义为:电子系统在规定的环境条件下,在1年的时间内,完成规定功能的概率。例如P=0.9,就说明系统在一年内有90%的可能不出现故障。(也即有10%的可能会出现故障)。如果在一个地点有10台同类设备,则平均1年会有1台设备可能需要进行维修。
国际通信卫星系统有关可靠度R(t)的参考数据如表4所列。
2.6失效率λ,平均无故障工作时间MTBF和可靠度R(t),故障概率F(t)之间的数学关系
依据λ,MTBF,R(t),F(t)的定义和基本数学表达式,经数学运算以后,可得出以下的相互数学关系(运算过程从略)。
(1)MTBF=1/λ或λ=1/MTBF,
即λ和MTBF互为倒数关系。
(2)R(t)=e-λt或R(t)=e-t/MTBF=1/et/MTBF,
即R(t)和λ之间为指数关系。
(3)F(t)=1-R(t)或R(t)=1-F(t),
这样,λ,MTBF,R(t)三个指标,可以通过上述换算,从一个量算出另两个量的对应数值。在不同的场合,以上三个指标都可能在衡量电子系统可靠性时交替使用。
3提高系统可靠性的途径
31认真从事系统可靠性的设计
电子系统的可靠性模型,大体上有以下三种形式:
(1)串联系统的可靠性模型
串联系统模型如图1所示。串联系统是指它的每一个元件对于系统的正常工作都是必须的,不可或缺的;任何一个元件的失效,将导致系统工作不正常。这是一种较常见和简单的系统。