最新动态

Yue Li Jian He

最新消息

您现在所在位置:最新动态 > 最新消息 >

虚拟化: 优化电源、制冷和管理使效益最大化(下)

日期:2022-10-10

本期我们来看最后两种IT虚拟化的影响和特性:动态的IT负载和降低对冗余的要求。

 

►►►

动态的IT负载

 

虚拟机的创建和迁移都可能在很短时间内完成,而且越来越趋于自动化,这需要严格的管理以及行之有效的措施对机柜级的基础设施状态和容量进行监测。如果不这样,那么虚拟化技术为云计算带来的软件层面的容错性将不复存在。可喜的是,业界已经有合适的工具来简化和实施这种措施。

 

物理主机上的电力负载会因虚拟负载在不同的时间、不同的主机之间创建和迁移,并不断变化。当处理器进行运算,而功耗随之变化;或者随硬盘存储与读取,所有物理或虚拟主机上的电力负载不断变化。这种变化还会在供电管理系统随运算需求变化而自动执行开启和关停设备时,变得更加显著。为供电设定额定值的规定可以减少这种变化。这样主机或虚拟机的最大功耗就可以受到约束从而对处理器进行约束。在任何额定值,由于数据中心物理基础设施通常按最高IT设备的额定值进行规划选型,在虚拟化比例比较低的时候,这种变化就不会引起物理基础设施容量的问题。

 

高度虚拟化的环境例如大型的云计算数据中心,与非虚拟化数据中心相比其负载变化幅度会更大,频率会更高。除非具有优良的规划和高效的管理,这些巨大变化会引起潜在的容量问题,或者违反与容量余量相关的规范。

 

呈不断上升趋势的是,数据中心管理软件自动地创建和移动虚拟机。这种独特的功能可以帮助虚拟化数据中心更具容错性。如果虚拟机或者主机崩溃导致软件应用的故障,其它的虚拟机能够很快地恢复工作负载,最小化用户的宕机时间。自动化的虚拟机创建和迁移在云计算中能够最大限度地提高运算能力的可扩展性。需要注意的是,这种突然的、快速的虚拟机迁移也会使IT负载暴露在供电和制冷的问题面前,使其承担风险。

 

DCIM软件和虚拟机管理器相集成确保机安全运行

数据中心基础设施管理(DCIM)软件能够监测和报告供电和制冷系统的健康程度和容量。这种软件还能追踪IT设备和物理基础设施之间的各种关系。好的虚拟机管理需要了解物理和虚拟服务器所安装的机柜内的供电和制冷系统。这种了解是非常重要的,因为如果缺乏了解就不能确保虚拟机创建和迁移至具有足够和健康的供电和制冷资源的主机上。

 

由于存在大量的需求,依靠人为操作来处理DCIM软件提供的信息并作出反应已经不能适用于管理容量。人为介入会存在人为失误的风险,是导致宕机的最大原因。这里所指的人为失误是由没有计算某一地点的供电和制冷可用性状态而导致的。自动化的DCIM信息监测和措施执行可以最大限度地减少风险。

 

数据中心基础设施管理(DCIM)软件能够提供实时的、自动化的管理,如图7中所示,VM管理器和DCIM软件以及由两者之间集成产生的互动,能够确保服务器和存储设备在需要的时间和地点得到供电和制冷。

 

图7 数据中心基础设施管理软件与虚拟机管理器相集成的案例

 

虚拟机在物理服务器之间的创建和迁移通常是为了获得足量的处理器、内存或者存储资源。而有效地管理系统可以使虚拟机的迁移依据实时的机柜级物理基础设施容量和健康程度。当DCIM软件与虚拟机管理器相集成,虚拟机就可以安全地且自动地迁移到有足够供电和制冷容量来处理额外负载的区域。反之,虚拟机在机柜间的迁移会造成电源和制冷方面的麻烦。例如,如果某个机柜突然断电、风机故障或者丧失冗余,虚拟机管理器应该得到告警,而处于危险状态的虚拟机可以迁移至数据中心其它地方安全的和健康的机柜。所有这些操作都能够实时地自动进行,而不需要人为介入。数据中心基础设施软件与虚拟机管理器相集成是确保虚拟负载和物理主机受到保护的一项极为重要的功能。这样将会更易于保持服务等级,而数据中心人员也不会在监测供电和制冷基础设施上花费太多的时间。

 

在供电和制冷容量被缩减或适度选型规划至虚拟化整合后的负载相匹配的时候,集成所扮演的角色就更加的重要。因为预留的容量越小,所能容纳虚拟机错误和失误的空间就越小。在负载不断快速变换的环境下保持高效的、度身的数据中心需要管理系统能与虚拟机管理器实时地自动配合工作。

 

同时,也不应忘记的是在建立与虚拟机管理相关的IT措施时也应该考虑供电和制冷系统。要实现这样的运行方式需要数据中心基础设施管理软件与虚拟机管理器相集成。根据供电和制冷容量、健康度和冗余度,措施规范应对其所接纳的应用或者虚拟机的范围和界限予以规定。

 

►►►

降低对冗余的要求

 

如上期“IT负载降低对PUE的影响”中所说,IT虚拟化对降低供电和制冷容量的益处广为人知。但是不太为人所知的是,IT虚拟化同样可以降低物理基础设施的冗余度。通过使用管理得当的虚拟机来提供容错性,这样基础设施冗余的降低可以简化设计,降低投资成本,并且为将来IT增长时部署其它设备节约空间。

 

高度虚拟化的环境在容错能力和恢复能力方面与RAID磁盘阵列相似。如果一旦出现问题,负载包括所有的虚拟机和虚拟存储设备都能自动地并且快速地通过网络迁移到安全的区域。这种通过转移资源来维持不间断服务的过程对用户来说必须是可见的。但是,根据IT实施的质量和虚拟机管理软件集成的深度,当迁移发生时,终端客户可能会经历短暂的不可见期。但是通常来说,在几台服务器或者几台机柜不可用的时候,服务等级仍然能够有效地达成。

 

具有这种容错性以后,在高虚拟化的数据中心环境中对高冗余性[2N或2(N+1)]的供电和制冷系统的需求会有所降低。假设某台UPS的故障不会导致业务中断,那么就不需要为其配置备用的冗余UPS系统。原先规划建设2N冗余的供电和制冷系统,也许现在就可以考虑建设两个N+1的数据中心取而代之。建设两个500kW的N+1供电和制冷冗余的数据中心所需的投资比建设一个1MW的2N供电和制冷冗余的数据中心的成本低35%。高度虚拟化环境下的容错能力使降低物理基础设施的冗余度成为了一种切实的选择。在做出这种决定之前,IT管理人员和设施管理人员应当全面的考虑如果物理基础设施故障或者不可用,其对业务连续性所可能产生的影响。这就意味着应该重新考虑和审视IT管理系统和制度以确保它们在降低物理基础设施冗余的情况下,有能力提供所需的服务等级和容错能力。物理基础设施的冗余性与虚拟IT环境的容错性相匹配,也是正确规划选型的一种方式。这种方式的正确规划选型能够进一步减少能耗,投资成本和固定损耗,从而改善数据中心基础设施效率PUE。

 

►►►

结论

 

数据中心IT资源虚拟化会对相关的物理基础设施产生影响。如果无视这些影响和可能产生的后果,虚拟化和云计算带来的巨大收益就会受到限制和削弱,在某些情况下这种限制和削弱是非常严重的。在服务器虚拟化之后会形成高密度的区域,热点的产生会导致硬件故障。因此要利用各种方法来确保制冷系统具有足够的措施和容量来可靠地冷却高密度设备。虚拟化整合之后PUE会显著地变差,通过对供电和制冷系统进行优化,能够使之与降低后的IT负载相匹配,这样可以恢复和改善PUE。如果采用可扩展和模块化的系统优化的实施会非常简易。动态的负载因为时间和地点的不同而变化,如果不实施机柜级供电和制冷的监控,会产生风险。仔细地规划和实时地管理可以确保虚拟机运行在供电和制冷都有保障的基础设施上。通过构建合理的虚拟机运行规范,以及将数据中心基础设施管理软件与虚拟机管理软件相集成,数据中心可以运行自动化的实时管理。最后,虚拟机管理软件可以通过管理虚拟机实现的高容错性,从而减少对冗余供电和制冷基础设施的依赖。这种策略的应用能够节省大量的时间、空间、电力能源和初投资成本。实施本系列文章所描述的解决方案能够为高度虚拟化的数据中心带来高度的可用性,能效和扩展的灵活性,进而满足高度动态运算的电力需求。

 

这三期我们通过分析高密度的产生、IT负载降低对PUE的影响、动态的IT负载和降低对冗余的要求,这四种IT虚拟化的影响和特性,进而了解了虚拟化的解决方案,以此帮助提升虚拟化数据中心的可用性及灵活性。

 


X