当前位置: 首页 > 新闻中心 > 电子产品可靠性设计知识ppt

电子产品可靠性设计知识ppt

发布时间:2024-03-31 0:05:25

  1. 电子产品的可靠性设计包括哪些内容
  2. 什么是可靠性设计
  3. 设备可靠性指标是指什么

一、电子产品的可靠性设计包括哪些内容

电子产品的可靠性设计包括许多内容,主要有可靠性分配、可靠性预测、冗余技术、漂移设计、故障树分析和故障模式、效应和致命度分析、元件器件的优选和筛选、应力-强度分析、降负荷使用、热设计、潜在通路分析、电磁兼容和设计评审等。 下,直到元件、器件、工艺、材料等的可靠性指标。

保证机械及其零部件满足给定的可靠性指标的一种机械设计方法。包括对产品的可靠性进行预计、分配、技术设计、评定等工作。所谓可靠性,则是指产品在规定的时间内和给定的条件下,完成规定功能的能力。

它不但直接反映产品各组成部件的质量,而且还影响到整个产品质量性能的优劣。可靠性分为固有可靠性、使用可靠性和环境适应性。可靠性的度量指标一般有可靠度、无故障率、失效率3种。

在产品设计过程中,为消除产品的潜在缺陷和薄弱环节,防止故障发生,以确保满足规定的固有可靠性要求所采取的技术活动。可靠性设计是可靠性工程的重要组成部分,是实现产品固有可靠性要求的最关键的环节,是在可靠性分析的基础上通过制定和贯彻可靠性设计准则来实现的。

二、什么是可靠性设计

问题一:可靠性设计的出发点是什么? 可靠性设计可以分成两个基本出发点:

?第一个就是“完美性设计”,通俗地讲就是怎弧保障我们的设计是完美的?最终的产品是完美的?如果在设计的时候,时刻提醒自己这个问题,促使自己多考虑,就应该明白为什么我们要求项目组在产品立项开发的时候就要考虑到外界对产品的可靠性需求,为什么我们要在方案设计阶段列出关键器件清单,为什么我们要核对关键器件的使用规范说明和器件规格书,为什么我们要控制器件选型的制造商和供应商认证,为什么我们要组织在开发过程中不断讨论产品可能存在的应用缺陷,为什么我们开发产品的时候眼睛要盯住客户的使用环境,为什么要建立部门设计经验库,为什么要引入众多的设计准则和查检表......所以,如果大家能时刻问自己怎样才能保证我设计的这个产品到客户应用现场后能按要求使用3年不出问题,还有哪些缺点待改进,是不是已经把所考虑到的问题都已解决了,是否已尽力保证了设计上的完美。只要理解了这个设计思想,正向的可靠性设计开展起来就会顺畅多了。

第二个就是“容错设计”,因为虽然我们在设计上尽量考虑的各种各样的情况,也尽力向完美设计靠拢,但实际上由于知识技能开发进度等限制,我们的设计不可能完美无缺,这时候如果出问题了应该怎么办。所以我们要考虑一些逆向的容错设计,先判断大概哪些地方会出哪些问题,出问题之后是否能及时检测到,或故障隔离,是否需要做安全防护措施等。这就是我们为什么要强调系统的自检流程和参数容差判断,故障识别和隔离措施,如果没办法判断隔离的话,是不是可以考虑提醒指示,加外围的防护单元,尤其涉及到系统安全状态时。

问题二:可靠性设计的重要性 可靠性设计是系统总体工程设计的重要组成部分,是为了保证系统的可靠性而进行的一系列分析与设计技术。它是通过系统的电路设计与结构设计来实现的。  “产品的可靠性是设计出来的,生产出来的,管理出来的”,但实践证明,产品的可靠性首先是设计出来的。可靠性设计的优劣对产品的固有可靠性产生重大的影响。产品设计一旦完成,并按设计预定的要求制造出来后,其固有可靠性就确定了。生产制造过程最多只能保证设计中形成的产品潜在可靠性得以实现,而在使用和维修过程中只能是尽量维持已获得的固有可靠性。所以,如果在设计阶段没有认真考虑产品的可靠性问题,造成产品结构设计不合理,电路设计不可行,材料、元器件选择不当,安全系数太低,检查维修不便等问题,在以后的各个阶段中,无论怎么认真制造,精心使用、加强管理也难以保证产品可靠性的要求。因此,我们说产品的可靠性首先是设计出来的,可靠性设计决定产品的“优生”,可靠性设计是可靠性工程的最重要的阶段。这是因为:(1)设计规定了系统的固有可靠性。如果在系统设计阶段没有认真考虑其可靠性问题,如材料、元器件选择不当,安全系数太低,检查、调整、维修不便等,那么以后无论怎样注意制造、严格管理、精心使用,也难以保证产品的可靠性要求。(2)现代科学技术的迅速发展,使同类产品之间的竞争加剧。由于现代科学技术的迅速发展,产品更新换代很快,这就要求企业不断引进新技术,开发新产品,而且新产品研制周期要短。实践告诉我们,如果在产品的设计过程中,仅凭经验办事,不注意产品的性能要求,或者没有对产品的设计方案进行严格的、科学的论证,产品的可靠性将无法保证。往往等到试制、试用后才发现产品存在质量问题,只得再做改进设计,这就使产品研制周期加长,推迟了产品投入市场的周期,降低了竞争能力。在产品的全寿命周期中,只有在设计阶段采取措施,提高产品的可靠性,才会使企业在激烈的市场竞争中取胜,提高企业的经济效益。(3)在设计阶段采取措施,提高产品的可靠性,耗资最少,效果最佳。美国的诺斯洛普公司估计,在产品的研制、设计阶段,为改善可靠性所花费的每一美元,将在以后的使用维修方面节省30美元。  此外,我国开展可靠性工作的经验证明,在产品的整个寿命周期内,对可靠性其重要影响的是设计阶段,见图。  综上所述,可靠性设计在总体过程设计中占有十分重要的位置,必须把可靠性工程的重点放在设计阶段,并遵循预防为主,早期投入,从头抓起的方针,并以开始研制起,就要进行产品的可靠性设计,尽可能把不可靠的因素消除在产品设计过程的早期。

问题三:现代机械设计中可靠性设计是什么意思 就是设计出来能加工出来,不会说设计上很美好,但实际上却无法加工出来。

机械设计制造及其自动化,指研究各种工业机械装备及机电产品从设计、制造、运行控制到生产过程的企业管理的综合技术学科。培养具备机械设计制造基础知识与应用能力,能在工业生产第一线从事机械制造领域内的设计制造、科技开发、应用研究、运行管理和经营销售等方面工作的高级工程技术人才。

以机械设计与制造为基础,融入计算机科学、信息技术、自动控制技术的交叉学科,主要任务是运用先进设计制造技术的理论与方法,解决现代工程领域中的复杂技术问题,以实现产品智能化的设计与制造。

问题四:可靠性设计有哪些方法 1. 冗余设计:类似并联电路;如,飞机的发动机,一般都挂两个,一个坏了,马上启动备用的;

2. 降额设计:让产品在额定值一下工作;如,某电阻额定电流1a,设计电路时让最大电流为0.75a,

就永远不会烧这个电阻了。

3. 热设计:受温度影响很大的产品,需要导热与散热来降低失效;笔记本的散热片、风扇等设计;

4. fmea:故障模式分析,逐一对每一个元件、零件、部件发问“它会怎么失效”,找出原因并加上预防措施。

问题五:可靠性设计的介绍 保证机械及其零部件满足给定的可靠性指标的一种机械设计方法。包括对产品的可靠性进行预计、分配、技术设计、评定等工作。所谓可靠性,则是指产品在规定的时间内和给定的条件下,完成规定功能的能力。它不但直接反映产品各组成部件的质量,而且还影响到整个产品质量性能的优劣。可靠性分为固有可靠性、使用可靠性和环境适应性。可靠性的度量指标一般有可靠度、无故障率、失效率3种。

问题六:质量管理学中什么是可靠性设计 可靠性设计本质是设计,就是通过设计使得产品的可靠性达到规定的或预期的要求。

首先要有定量定性的可靠性指标要求,

建立可靠性模型,形成可靠性分配,实现可靠性预计,建立可靠性设计准则。

其它具体方式,如,耐环境设计、冗余设计、电磁兼容性设计、降额设计、热设计等。

问题七:可靠性设计的分析 通过设计实现产品可靠性指标的方法。产品的可靠性是通过设计、生产和管理而实现的,而首先是产品的设计。它决定着产品的固有可靠性。电子产品可靠性设计技术包括许多内容,主要有可靠性分配、可靠性预测、冗余技术、漂移设计、故障树分析和故障模式、效应和致命度分析、元件器件的优选和筛选、应力-强度分析、降负荷使用、热设计、潜在通路分析、电磁兼容和设计评审等。可靠性分配根据用户对系统或设备提出的可靠性指标,对分系统、整机等组成部分提出相应的可靠性指标,逐级向下,直到元件、器件、工艺、材料等的可靠性指标。可靠性分配是系统或设备的总体部门的一项可靠性设计任务。对于有l个组成成分的系统,最简单的情况是这些组成成分的可靠性是互相独立的。若第i组成分不可靠,则系统就不可靠,系统可靠性为q=q1q2…ql 〔若第i组成分的不可靠性为pi=1-qi,则系统的不可靠性为p=1-q=1-(1-p1)(1-p2)…(1-pl)≈p1+p2+…+pl〕。这是系统可靠性分配的基本公式。可靠性分配本质上不是数学问题,而是人力、物力的统一调度和运用的工程管理问题。因为不同整机、元件、器件的现实可靠性水平是很不相同的,而把它们的可靠性提高到一定水平所需要的人力、物力和时间往往差别很大,因而不能采取均匀提高的纯数学方案。在实际工作中,需进行多个方案的协调、比较后才能决定。可靠性预测主要是根据电子元件、器件的故障和产品设计时所用的元件、器件数和使用条件,对产品的可靠性进行估计。最简单的情况是:产品由k种电子元件、器件组成,第i种元件、器件的寿命为指数分布,故障率为λi,用量为ni。任一元件和器件发生故障都会引起产品故障,故产品的故障率为λ=n1λ1+n2λ2+…+nkλk这是在设计阶段根据元件、器件的故障率对产品故障率提出预测的基本公式。在实际使用时,还要增加一些修正和补充。元件、器件的故障率还会随环境和其他条件而发生变化。若实验室条件下的元件、器件的故障率,则在环境a下的故障率为式中为元件、器件在环境a下的环境因子。在恶劣环境下,环境因子值可能很大。例如,导弹发射环境下的环境因子可能达到20~80。用预测公式测得的λ值还需要乘上一个修正因子(1+α)。对于比较成熟的设计,α可取10%左右;对不太成熟的设计,α可取30%以上。预测的故障率与实际投入使用后的现场故障率有一些差异是正常的。事实上,在设计阶段可靠性预测主要是相对可靠性,而不是绝对可靠性。冗余技术当产品设计中发现某个组成部分的可靠性过低,影响产品的总可靠性指标时,便采取所谓冗余技术来提高这一部分的可靠性。有k个组成部分的产品,各组成部分的可靠性是互相独立的。若其中一个部分出故障,产品就出故障,则这些组成部分构成一个可靠性串联系统。若产品的第i部分的可靠性为qi,则产品的可靠性q=q1q2…qk;若其中的一个部分不出故障,产品就能完成预定任务,则这些组成部分构成一个可靠性并联系统。这时,q=1-(1-q1)(1-q2)…(1-qi)。如果k=2,q1=q2=0.99,则组成可靠性并联系统后,q=0.9999。即经可靠性并联后大大提高了可靠性。所谓“多数表决”冗余技术,是只要k个组成部分中多数不出故障,产品就能完成预定任务。一般说来,很少使用整机作为冗余的组成部分,通常是对整机的薄弱环节进行冗余处理。漂移设计元件、器件的性能参数容许有一定的散布。其上限为上公差,下限为下公差。随着出厂时间的增加,性能参数产生漂移。温度和其他环境条件的变化也会造成参数漂移。只要元件、器件的漂移不超过公差的上、下限,就是合格的。电路的设计应该是......>>

问题八:可靠性设计的原则 ①按重要程度分配可靠度。②按复杂程度分配可靠度。③按技术水平、任务情况等的综合指标分配可靠度。④按相对故障率分配可靠度。各部分有了明确的可靠性指标后,根据不同计算准则,进行零件的设计计算。主要的计算方法为:根据载荷和强度的分布计算可靠度或所需尺寸;根据载荷和寿命的分布计算可靠度或安全寿命;求出可靠度与安全系数间的定量关系,沿用常规设计方法计算所需尺寸或验算安全系数。与可靠性设计有关的载荷、强度、尺寸和寿命等数据都是随机变量,必须用概率统计方法进行处理。

问题九:可靠性设计软件有哪些 嵌入式系统可靠性设计技术及案例解析》介绍了嵌入式系统设计中,哪些地方最可能带来可靠性隐患,以及从设计上如何进行预防。内容包括:启动过程和稳态工作中的应力状态差别等可靠性基础知识及方法;降额参数和降额因子的选择方法;风扇和散热片的定量化计算选型和测试方法、结构和电路的热设计规范;pcb板布线布局、系统结构的电磁兼容措施;电子产品制造过程中的失效因素(包括eos、esd、msd等)及预防、检验方法;可维修性设计规范、可用性设计规范、安全性设计规范、接口软件可靠性设计规范等方面的技术内容。同时,针对相关内容进行实际的案例分析,以使读者更好地掌握这些知识。

问题十:什么是产品的可靠性? 对产品而言,可靠性越高就越好。可靠性高的产品,可以长时间正常工作(这正是所有消费者需要得到的);从专业术语上来说,就是产品的可靠性越高,产品可以无故障工作的时间就越长。

可靠性包含了耐久性、可维修性、设计可靠性三大要素。 耐久性:产品使用无故障性或使用寿命长就是耐久性。例如,当空间探测卫星发射后,人们希望它能无故障的长时间工作,否则,它的存在就没有太多的意义了,但从某一个角度来说,任何产品不可能100%的不会发生故障。 可维修性:当产品发生故障后,能够很快很容易的通过维护或维修排除故障,就是可维修性。象自行车、电脑等都是容易维修的,而且维修成本也不高,很快的能够排除故障,这些都是事后维护或者维修。而象飞机、汽车都是价格很高而且非常注重安全可靠性的要求,这一般通过日常的维护和保养,来大大延长它的使用寿命,这是预防维修。产品的可维修性与产品的结构有很大的关系,即与设计可靠性有关。 设计可靠性:这是决定产品质量的关键,由于人――机系统的复杂性,以及人在操作中可能存在的差错和操作使用环境的这种因素影响,发生错误的可能性依然存在,所以设计的时候必须充分考虑产品的易使用性和易操作性,这就是设计可靠性。一般来说,产品的越容易操作,发生人为失误或其他问题造成的故障和安全问题的可能性就越小;从另一个角度来说,如果发生了故障或者安全性问题,采取必要的措施和预防措施就非常重要。例如汽车发生了碰撞后,有气囊保护。

三、设备可靠性指标是指什么

设备可靠性指标是指什么

设备可靠性指标是指什么,想必大多数人都对设备可靠性指标不是很了解,如果你不清楚的话,下面就跟着我一起来看看设备可靠性指标是指什么吧,希望我能够帮助到你。

设备可靠性指标是指什么1

可靠性是指产品在规则的条件下和规则的时刻内,完结规则功用的能力。任何产品不论是机械、电子,还是机电一体化产品都有必定的可靠性,产品的可靠性与实验、规划和产品的保护有着很大的联系。衡量可靠性的指标很多

机械设备可靠性指标

1、可靠度r(t),即产品在规则条件下、规则时刻内完结规则功用的概率,亦称平均无故障时刻mtbf(meantimebetweenfailure);

2、平均维修时刻mttr是指产品从发现故障到康复规则功用所需求的时刻;

3、失效率λ(t),是指产品在规则的使用条件下使用到时刻t后,产品失效的概率。

产品的可靠性改变一般都有必定的规律,其特征曲线形状像浴盆,通常称之为“浴盆曲线”。在实验和规划初期,因为产品规划制造中的错误、软件不完善以及元器件筛选不够等原因此形成早期失效率高;通过批改规划、改进工艺、老化元器件、以及整机试验等,使产品进入安稳的偶然失效期;使用一般时刻后,因为器件耗费、整机老化以及保护等原因,产品进入了耗费失效期。这就是可靠性特征曲线呈“浴盆曲线”型的原因。衡量一个电子产品、尤其是工业类产品很常用的是mtbf,也就是平均无故障时刻。

设备可靠性指标是指什么2

技术性能指标主要包含以下两方面:

1、技术参数包括:尺寸参数、运动参数与动力参数。

2、技术参数是其中的一部分,还包括结构、工艺适应性、精度、使用可靠性和宜人性等方面。

通俗地说:性能指标就是硬件参数是衡量这个硬件好坏的指标。

扩展资料:

外存储器的容量

外存储器容量通常是指硬盘容量(包括内置硬盘和移动硬盘)。外存储器容量越大,可存储的信息就越多,可安装的应用软件就越丰富。硬盘容量一般为10g至60g,有的甚至已达到120g [2] 。

i/o的速度

主机i/o的速度,取决于i/o总线的设计。这对于慢速设备(例如键盘、打印机)关系不大,但对于高速设备则效果十分明显。例如对于当前的硬盘,它的外部传输率已可达20mb/s、4omb/s以上。

设备可靠性指标是指什么3

可靠性即产品在规定的条件下、在规定的时间内完成规定的功能的能力,是衡量产品品质的关键要素之一。h3c在该领域经过多年的实践和积累,教训很多收获更多。本文以h3c产品为例,就通信产品硬件工程类的可靠性保证作简要探讨,借此让大家对通信设备以及h3c产品从研发到量产的可靠性过程有个初步了解。

随着互联网的普及,网络正成为人们工作和生活越来越重要的组成部分。人们用它听歌看电影玩游戏,企业用它建立运营体系、存储数据、下发生产指令。试想某天当我们无法上网时,会是怎样的境况?你将无法在msn上和好友畅聊,无法在google地图上查找交通路线,无法在家了解股票行情……习惯依赖互联网的我们将不得不改变生活方式。对于企业来说,停机除造成直接的经济损失外,还可能引发社会影响和信任危机。美国infonetics research对80家大型企业调查发现,由网络故障造成的损失平均占年销售额的3.6%。

就像电话一样,人们希望网络也能“想用就用”,可靠性的专业术语就是“可用度高”。实现高可用网络的方法,除了像冗余备份、提高故障诊断能力、增加备件这些减少设备宕机时恢复时间的方法之外,还包括一个重要的指标就是设备的可靠性。

可靠性管理:可靠性保证和增长的基础

之所以把可靠性管理放在第一位,优先于可靠性设计、分析和试验,是因为我们认为后者都是具体的、细节的技术或方法,是可以短期内修正或完善的,而可靠性管理则代表了一个公司可靠性领域在流程和制度上的成熟度,需要时间、实践、经验和数据的积累和沉淀,可以说是员工心智和公司文化的体现。

h3c经过两年的实践摸索,于2005年正式将可靠性纳入公司的流程管理,作为产品开发过程中的重要一环。对于研发的每款产品,我们都会制定相应的可靠性规格和过程实施计划。可靠性规格是产品概念阶段在可靠性指标上的承诺,根据各方面的需求决定出要做什么样的产品。可靠性过程计划则明确定义什么阶段、由谁、完成哪些可靠性工作,达到什么目标,过程如何规范,交付哪些内容,在执行上保证了规格承诺的兑现。

举例来说,器件管理和优选便是可靠性管理体系中的重要组成部分。做过产品开发的人都知道,不同厂家的同型号器件,往往很难做到所有参数完全一致。当器件参数不一致时,产品在设计初期就需要考虑通过容差设计来兼容这些器件,这样就对设计和制造提出了更高的要求,一定程度上提高了设计制造的难度和成本。随着供应商和器件型号的增加,管理费用迅速上升,彼此沟通变成了一个费时费力而且低效的.工作。另一方面,设计和制造也不断出现由“兼容设计”引起的问题,允许免检直接入库的器件变少。对于这种问题,在h3c,有专门的部门负责器件优选和认证管理工作,他们跟踪业界器件技术发展的动态,对制造、客户出现的器件问题进行跟踪和数据搜集,提供各类优选器件清单,使器件选型工作简单有效。当有器件需要替代时,必需经过足够的审核、测试和小批量验证才能被规模使用。

可靠性增长的一个重要方法是应用fracas系统(failure report analysis and corrective action system),其原理是利用“故障反馈、闭环控制、预防再发生”,通过一系列规范化的工作程序,及时报告产品故障,分析故障根因并纠正,通过临时规避措施减少故障的影响,通过预防再发生的解决措施实现产品可靠性的增长。在h3c,从研发、试产、生产到客户现场,各环节不同程度都在实施故障报告和闭环。以hasa(highly accelerated stress audit,高加速应力稽核)流程为代表,该流程融入了fracas和8d的思路,对每一台hasa过程出现问题的设备,都建立流程跟踪,从条码记录、故障现象、故障风险分析、根本原因总结到解决措施、闭环实施,把各环节有机整合起来,实现发货前检验的高效率和问题闭环的有效性。将每个hasa失效都看作改进过程的机会,从而使解决问题的投入达到利益最大化。

有人说,世界上只有上帝可以不用数据说话。根据流程,我们把所有和可靠性相关的关键数据都集成到了qa系统的可靠性模块。在这里,可以查到某款产品在特定发货时间的市场失效情况,可以跟踪市场实际mtbf、累计失效率、制造批次相关的失效率等等。通过数据分析和同类产品比对,去发现设计、制造、管理各环节可以提高的机会,实现进一步的可靠性增长。

良好的可靠性管理通过建立一套严格的纪律,指导我们什么时候要做什么事情;可以让今天的教训成为明天的预防,在明天就“一次性把事情做对”;可以让我们“站在巨人的肩膀上”,做任何事情都不是从零开始。而所有的目的,只是为了实现可靠性目标的承诺,保证提供给客户的产品,在承诺的时间内是高可靠的、是满足客户要求的。

可靠性设计:关注细节,重在执行

谈到电子产品可靠性设计,我们几乎马上会想到热设计、元器件降额、容差容错设计、可靠性预计等等。就像小学作文,中心思想是确定的,关键看如何写这篇文章。可靠性设计是否成功,有两点必不可少,其一是执行,其二是细节。

我们先说执行。以降额设计为例,不少公司都有降额设计规范,看上去很美。但这个规范是否被严格执行了还是被束之高阁,超出降额的器件有没有被专业评估,降额要求是否根据制造/市场元器件的表现调整,不同产品是否需要分别对待实现全寿命成本最优,都是可靠性实现的关键。再如热设计,在h3c,热设计由可靠性工程师保证。每款产品,在开发初期,都会对散热进行评估和仿真,提前释放散热风险。在整个评估过程中,可靠性工程师和结构工程师、产品开发人员、互连设计工程师的沟通是非常紧密的。风险没有释放,就不能通过下一个技术评审点。

其次是细节。航空爱好者知道,1980年,阿丽亚娜火箭第二次试飞时,一名工作人员不慎碰落一个部件的商标,堵塞了发动机燃烧室的喷嘴,造成发射失败。1985年,美国发射“三叉戟”导弹,由于发动机燃烧室中剥落了一块黄豆大的绝缘层,结果高温火焰烧穿了那里的金属壁,燃气向外喷射,发动机爆炸。可靠性设计是一个需要注重细节的工作,所谓“千里之堤,溃于蚁穴”,“paying attention to details”是直接写入到美军标338中的,或者这也是经验和思考的总结。

以h3c为例,热设计中的热仿真过程不但仿真常态情况,还会对风扇停转等异常状态进行仿真;在降额设计上,对各类器件电应力进行遍历审查,对不同风扇转速下热应力进行遍历测试,保证在规定环境下每个器件承受的应力满足降额要求;对易损耗的器件进行寿命评估,保证在规定时间内设备符合用户的要求;对关键电路进行容差设计和仿真,保证器件参数随环境应力、寿命漂移时,电路依然可以可靠工作。

可靠性分析:防患未然,心知肚明

可靠性分析主要包括三部分:可靠性预计、fmea(故障模式影响分析)和fta(故障树分析)。可靠性预计通过mtbf、返修率等指标作为维修、备件成本的预计,或整网可用度的评估,对设备可靠性增长贡献不多。fta构造繁杂、对人员经验和技能要求高、容易出错。对于复杂产品,fmea是一个防患未然的有效方法。举个简单的例子,我们有时会遇到十字路口红绿灯失效的情况,想想我们最不希望哪种失效现象出现?显然,当两条路上同时出现绿灯时交通事故隐患就被埋下了,这是我们最不希望发生的。那么在开展交通信号灯控制系统的fmea分析时,就要关注哪些器件失效会出现绿灯同时点亮的情况,是否有解决方法。

在h3c,复杂系统会开展fmea分析工作,从而对系统中可能出现的故障现象做到心知肚明,评估容错设计是否足够。对于冗余备份系统,保证失效发生时设备可以快速倒换,业务正常运行不受影响。

可靠性试验:真金不怕火炼

我们研发出来的每一款产品,都会经受可靠性试验的洗礼,其中最严酷的当属halt试验(highly accelerated life test,高加速寿命试验)。

90年代halt试验在国外获得推广,而国内企业由于各种限制起步相对较晚。与传统的施加模拟客户环境的应力来发现故障的环境试验不同,高加速应力是一种主动的试验。使用应力步进的方法,使设备不断接近极限应力,直到故障暴露。通过“暴露缺陷—不断改进—再试验—再改进”的方式,持续发现并解决设计、来料、工艺等相关问题,从而获得产品的快速稳定。这有点像运动员的训练,如果要参加100米短跑比赛,那么运动员平常训练时绝不会只是重复训练100米冲刺,力量和耐力的训练必不可少。同样道理对于产品来说,虽然标称工作环境是0~40/45℃,halt试验过程中其实都会经受100℃高温和-40℃低温的极限考验。

到这里,可能你会提出两个问题:1,halt试验做到-40℃和100℃有没有必要,室内应用的产品,怎么可能有这样的环境?经验告诉我们,非常必要且获益匪浅!按照h3c工程师的说法,现在不作halt试验“心里没底”。2,厂家宣称的0~70℃的器件能在-40~100℃环境工作吗?实践表明,在可靠的电路设计下,器件完全可以承受比规格更高的应力(极少数器件例外)。

如果你是做可靠性的同行,或者正在经受halt问题的煎熬,可能还有第3个疑问,为什么可以用环境应力暴露未来5年甚至10年可能出现的可靠性问题?研究一下元器件资料,看看容差设计的原理和品质管控方面的书籍,就会发现一个共同点:器件参数漂移。当一个器件在极限环境应力下参数漂移范围比工作5年参数漂移范围更宽时,只要该器件在电路环境中能承受极限应力,你就基本可以放心未来5年参数漂移引发失效的模式不会在电路中发生。其他原因如振动累计损伤、磨损引起的失效加速分析等,这里不再展开。

除了halt试验,在h3c,我们还采用了一个时尚前卫的可靠性保证手段,那就是hasa筛选。

研发出来的产品,到量产后,由于器件批次间的参数离散、工艺控制的原因,可靠性有可能会降低。hasa利用温度、振动、电应力、数据流量等多应力同时施加的方式,有效筛选出故障设备,从而实现量产产品在质量和可靠性上的快速稳定。我们通常的hasa筛选应力远超出设备工作应力,比如温变率,典型应用环境温变率不会超过0.5℃/分钟,h3c筛选应力是40℃/分钟。

其他常规试验如温湿度类试验、机械类试验、emc的浪涌/静电/抗干扰试验,都是h3c产品的必检项,通不过这些试验,产品是无法到达客户手中的。