不间断电源
当前位置:首页 > 新闻动态 > 各种机架电源冗余配置的可用性比较

各种机架电源冗余配置的可用性比较

发布日期:2012-8-13

简介

配备冗余电源的设备也称为双路设备,具有冗余电源,每个电源使用自己的电源线。使用双路设备是"最佳方案",有助于保证IT设备达到最高的电源可用性,并提供必要的冗余,避免因为配电系统中的单点故障而造成停机。这种增加的冗余功能还便于进行电源系统的维护。但是,当今大多数任务关键环境都没有完全享受到这种最佳方案带来的好处。本文提供了可以在当今的数据中心中实施的各种电气架构方案。然后对各种方案进行可用性分析,并提供分析结果。

为机架配电的方法

下面的插图概述了可以提高机架安装设备可用性的各种方法,这些方法也适用于单机设备。通常根据所需可用性级别的目标选择不同的方法,提供的可用性级别越高,成本可能也越高。图1和2显示在当今的数据中心机架中通常如何配电。

图1(左)典型的机架安装UPS电源;图2(右)典型的集中式电源

图1显示在中小型数据中心和配电室使用的典型机架配电配置。此配置考虑了内置备用UPS电池和电涌保护的便于移动的机架。在使用了数十个或数百个机架的数据中心中,象图2中采用大型集中式UPS电源的配置更为常见。两种情况下的机架配电都没有电源冗余。

其它电气架构使用设备从主电源切换到备用电源。此类设备包括静态转换开关(STS)和自动转换开关(ATS)。这两种设备的容量从大约1kW到1MW以上。

图3自动转换开关(ATS)和静态转换开关(STS)示例

图4和5说明有时在大型任务关键设施中如何配电。在这两种情况下,有两个冗余线路通向STS,不过,为UPS供电的设备电源也许是冗余的,也许不是冗余的,这取决于公用事业公司的成本和是否设有变电站等因素。两种方案唯一的区别就是图4在静态开关的输出端使用单变压器,而图5在静态开关的输入端使用冗余变压器。不过,在两种情况下,STS、输出端分配电盘以及关联的布线都是潜在的单故障点。这些方法提供一定的冗余,但是其它没有冗余的部件存在出现故障的危险,可能会造成维护困难。

图4使用-STS-的负载的冗余

图5使用-STS-的负载的冗余

图4和5是对图1和2中所示的数据中心配置的改进,但是仍没有为机架提供完全冗余。尽管增加了冗余的UPS和变压器,静态开关、分配电盘以及关联的布线都是单故障点。

图6解决了图4和5中存在的单故障点的局限性,方法是对负载实现冗余。此解决方案去掉了STS,增加了一个分配电盘,因此,利用机架式自动转换开关(ATS)使冗余带来的好处更接近负载。机架式ATS输入端的任何维护设备现在无须去除负载即可完成。尽管此方案比图4和5中显示的非冗余组件要少,机架式ATS仍是单故障点,设备自己的电源也是单故障点。

图6使用机架式ATS的负载的冗余

图7显示如何才能使用具有冗余电源的双路设备实现负载的完全冗余。此方案与图6相比有两个重要的改变:去掉了机架式ATS,使用了双路设备。现在,负载上直接实现完全冗余。还要注意,使用了机内的双PDU来保证冗余。与前面介绍的解决方案相比,此解决方案可用性高;不过,也是最昂贵的解决方案,只能与专门为此用途设计的双路设备配合使用。

图7使用双路设备的负载的冗余

图8中的架构将图6和7的架构组合在一起,介绍一种既包括单路负载又包括双路负载的备选解决方案。此解决方案解决了以前介绍的设计。保证双路计算机设备的完全电源冗余。对于单路设备,冗余可以保持到机架式ATS,不过,开关和设备电源现在还是单故障点。

图8还显示了增加的物理分离。这种分离通常称为"隔离",其中配电和备用系统中的各种子系统在物理上是分离的。物理分离如果实施得当,可以避免发生一条线路上的机械、电气故障影响第二条线路(常见原因的故障)之类的严重事件。

图4、5、6和8中介绍的架构包括转换开关。对于较大的转换开关,一个故障可能会使设备相当大的一部分关闭,而较小的开关中的故障只会使一个机架关闭。对于某些用户,任何一个机架的故障与50个机架的故障给生意上带来的后果是相当的;而对于其他用户,隔离单个机架的故障就是一个优势。对于后一种类型的用户,机架式ATS增强了故障隔离的可用性优势。

另外一个要考虑的因素是修理这些开关所需的时间。小的转换开关不是修理,而是更换,可以作为备件保留,以便可以很快的更换。此外,如果需要,可以快速地旁路。较大的开关则需要修理,根据所在位置的不同,维修人员需要几个小时的时间才能到位。诊断和修理系统还需要更长的时间,如果技术人员没有所需的部件,甚至还需要更长的时间。因此,在评估某些较先进的设计时,应对各种问题进行评估,做出最佳的决策。修理时间在下一节介绍的统计可用性模型中会考虑。

通常,如果努力建立一个高可用性的任务关键环境,只有一路电源线的设备可能是一个重大缺点。这条原则不仅仅适用于机架安装设备,也适用于任何任务关键设备。即使是最好的构造,任何单故障点最终会出现故障而造成停机。如果需要真正的高可用性环境,配电中的单故障点如果无法完全排除,必须尽可能少。

图8单路和双路负载的冗余架构

可用性分析方法

进行可用性分析是为了量化包含单路设备和双路设备的影响。需要进行五种可用性分析:

•第1种情况—图2中的单路负载
•第2种情况—图4中使用静态转换开关的单路负载(单变压器)
•第3种情况—图5中使用静态转换开关的单路负载(冗余变压器)
•第4种情况—图6中使用机架ATS的单路负载
•第5种情况—图7中的双路负载

线性组合分析也称为可靠性方块图(RBD),用于说明这五种配置的插座的电源可用性。这种系统建模方法最直接,适合状态转换非常少的系统。线性组合分析的工作原理是:使用已定义的可靠性数据,然后建立一个系统模型,代表所分析的配置。因为此分析仅针对配置之间的区别,所以,假定UPS电源系统的所有输入部分非常好,包括市电。因此,此处提供的可用性会高于实际安装中预期的可用性。

附录中提供了分析的详细信息。

分析中使用的数据

用于为组件建模的大多数数据均来自第三方。机架ATS的数据基于施耐德电气旗下APC的机架ATS产品的现场数据,这款产品已经面市大约5年,拥有广大的安装客户群。在此分析中包含以下关键部件:

1.端接点(末端端子)
2.断路器
3.UPS系统
4.配电柜
5.静态转换开关(STS)
6.机架ATS

配电柜细分为三个基本的子组件:断路器、隔离变压器和末端端子。分配电盘根据一个主断路器、一个支断路器和端接点全部在系列中进行评估。机架ATS组件仅在第四种情况下使用。附录中包括每个子组件的故障率和恢复率数据的值和来源,其中MTTF是平均故障时间,MTTR是平均恢复时间。

附录中介绍分析所使用的故障率和修复率。

分析中使用的假设

与任何可用性分析一样,要建立有效的模型,必须进行一些假设。表1列出了此分析中使用的基本假设。

表1分析的假设

结果

您一定要了解,此分析的目标是比较各种情况之间的理论可用性。因为所有五种情况的所有组件的故障率数据相同,所以,每种情况之间的唯一区别在于组件的数量、MTTR和位置。此方法通过将一种架构与另一种架构进行比较,可以非常有效地证明可用性的效果。

可用性的评估是针对为关键负载供电的插座。在每种情况下,使用相同的组件可靠性数据。在第1种情况下,该链中的任何一个组件的故障都会造成负载停用。这是基本情况。

在第2种情况和第3种情况下,每个冗余线路上的任何一个组件必须同时出现故障,负载才会停用。不过,STS的任何单个组件输出设备的故障(包括STS)也将使负载停用。这种情况的明显结果就是STS的安装几乎不会提高系统的可用性。原因是STS的可靠性并非明显高于输入UPS,STS仍是单故障点。还要注意,在第2种情况下,变压器MTTR使STS的所有好处几乎化为乌有。

在第4种情况下,每个冗余线路上的任何一个组件必须同时出现故障,负载才会停用。尽管机架ATS的MTTR是单故障点,但是因为在有备件的情况下可以快速更换,所以影响不大。此处发现的关键点是尽管机架ATS并非一定比大型STS更可靠,但是低得多的MTTR使其具有非常大的可用性优势。

在第5种情况下,每个冗余线路上的任何一个组件必须同时出现故障,负载才会停用。表2概述五种可用性计算的结果。

表2可用性结果的总结

此分析说明为在双端电气架构中实现高可用性双路设备有多么重要。使用单路设备无法完全利用这种复杂设计的优势,但是通过实施机架ATS差不多可以利用这种优势。

从上面提供的结果来看,对负载实现冗余很明显提高了可用性。图9证明,即使产品的可靠性(MTTF)提高了10倍,提供的可用性仍然不如使用可靠性较低的冗余套件。冗余系统提供的可用性接近100%,或多个"9"。

可用性与-MTTF

结论

在实施高可用性架构时,机架配电需要认真考虑。本文中所述的典型配电类型在所产生的停机时间方面各不相同,可达10000倍。

此分析非常清楚地证明在关键数据中心中使用双路设备的重要性。此处提供的分析表明,完全双路架构与单路设计相比,停机时间最多可以少10000倍。

使用转换开关提高单路负载可用性的通常做法根据实施方式的不同,结果会大不相同。在某些情况下,该分析表明使用大型STS几乎没有任何好处。相对而言,如果使转换开关接近机架,配电系统造成的系统停机时间将降低,以250为系数。

此外,基于机架的转换开关提供了额外的故障隔离,因为故障仅会去掉一个机架。另外,基于机架的转换开关可以根据需要在双路环境中部署。

此数据表明,使用大型STS系统为单路负载供电的通常做法应进行重新评估,成本几乎类似的基于机架的转换开关具有明显的优势。

通常,该分析表明,一般原则是,对负载实现冗余可以提高可用性。

投资任何高可用性系统时,认真分析是一个必要的前提。客户愿意花多少钱来加强电气基础设施决定了要选择哪种解决方案。客户必须清楚地了解业务流程,以便可以计算停机成本。此成本最终将推动在可用性方面的投资。

 

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注