可靠性大纲和红头文件驱动的军工产品可靠性工作

我一共供职过两个企业:航天某研究院和华为。应该说,这是差异很大的两类企业,前者属于军工领域国企,后者属于电子信息领域民企,两者的不同更多地体现在工作模式和体制上。

 

华为的可靠性工作我以前介绍过很多了,今天来回顾一下90年代初期在航天某研究院的可靠性工作经历。因为年代久远,不一定有代表性,仅供参考。

军工产品的可靠性工作,主要有两大驱动力:“可靠性大纲”和“红头文件”。

可靠性大纲

在一个型号立项之初,军方(用户)会依照相关标准和惯例,对型号的可靠性提出要求,通常是平均故障间隔时间(MTBF)之类的可靠性指标。

然后研制单位的总体部会将指标分解给下面负责各子系统研制的研究所,并制订相应型号的可靠性工作大纲。

型号的可靠性大纲是指导这个型号可靠性工作的基本文件,其依据通常是国军标GJB 450《装备可靠性工作通用要求》。

GJB450应该说还是一个比较全面的指导型号可靠性工作的标准,但具体到某个型号上,通常都需要根据该型号的实际情况对其中的工作项目进行裁剪。

当时真正能够把GJB450规定的工作项目全都实施的型号并不多,能做的主要包括可靠性预计、环境试验和可靠性鉴定等少数几项工作项目。

因为这几项工作是军方比较关注的,也是能够证明产品满足军方使用可靠性要求的最直接的方法。

在型号可靠性大纲的制订过程中,总体部、各负责子系统研制的研究所以及军方(军代表)都要经过几轮艰苦的博弈(PK),才能最终确定相应的工作项目和工作方案,比如最终的可靠性鉴定试验方案采用哪种结尾方式,小批量样本的试验数据不够怎么办等等。

 

完成型号可靠性工作大纲中规定的可靠性工作并不具有任何挑战性,基本上按照“标准的”方法做完写个报告就行了。

当时我刚刚毕业,对可靠性的理解也非常有限。所以在我自己的潜意识里,基本也没有去思考做这些工作到底有什么用的问题,也没有人促使我去思考,我只是简单的以为:这就是可靠性工作,这就是我该做的,而我也按照要求干就算完成了我的工作。

甚至在我整个军工企业的职业生涯中,几乎没有人会去质疑我所做的工作的价值,以及我所写的报告的内容,你就认真地按标准要求完成各种报告就OK了。

唯一的一次印象十分深刻,是在一次型号可靠性评审会上,评审小组由航天体系跨院所的很多专家组成,组长是当时任航天标准化所的何国伟所长担任。

评审会期间,何老翻看着各种报告,突然问道:xxx型号可靠性预计报告是谁写的?坐在角落里的我赶忙起身走到何老身前,怯声道:我写的。

何老问:你用的应力法算的,但这里面每个器件的应力你是怎么得到的?我支支吾吾的答不上来。何老也没难为我,可能他也很清楚,这样的报告基本都是照猫画虎从以前的报告里抄过来的。

红头文件

 

上级机关发“红头文件”这种情况通常发生在某些特定时期,比如某段时间事故频发,“上头”就会以“红头文件”的形式要求下面的院所开展质量和可靠性的专项工作。

文件从质量体系下发到我所在的质量处,然后按照要求,我就拿着文件挨门挨户的请所长、总师、各处室领导审阅,等所有领导都在相应位置写上“阅”后,我就开始干活儿了。

其实基本也是照章办事,因为“红头文件”上通常会明确规定要开展哪些质量可靠性专项工作,比如质量清零、FMEA/FTA等。

这时的“红头文件”对我来说就是尚方宝剑,那些平时对可靠性工作不屑一顾的研究室的工程师们,看到红头文件,也不得不配合,虽然也只是表面上的。

同样的,大家都只是关注事情有没有做,而并没有人去关注做事情的效果,可能他们觉得做了这些事就一定会有效果吧。

 

当然这些都是三十年前我在军企工作时的体验了,这么多年过去了,应该会有所改观了。

其实可靠性工作开展得如何,与产品的实际可靠性并没有绝对的直接关系。或者说,可靠性工作开展得好,产品的可靠性就好;但反过来,可靠性工作开展得不好,并不代表产品的可靠性就一定不好。军品就是这样。

 

相对于后面我所任职的华为来说,就可靠性的开展程度和效果上,之前的军企显然不够好,但我们的武器装备的可靠性其实还是不错的,这似乎有点矛盾。

仔细思考,可能是与军品的开发模式有关,其中主要是受开发周期和成本的影响。军品的开发周期通常很长,而且基本可以不计成本。

比如一个型号的导弹,从研制到定型交付部队一般要几年甚至十几年,期间可以有大量的时间做各种测试和试验,来发现问题。

从各子系统自己做的各种测试和试验,到实验场的联调,再到靶场的试射,充分的暴露问题,等交付部队时,问题暴露得也差不多了。

就像任老板说捷达汽车,经过80年的磨合,把所有的bug都消除了,因此成为了”最好的“汽车。