Vertiv 关键任务指南
设施服务
什么是数据中心
服务?
无论是企业、行业组织、托管型数据中心或托管服务提供商,亦或是电信公司,数据中心运营者和设施经理通常会经历计算资源使用量日益增加的情况。这些 IT 主管希望能够实现增长,保持计算和存储资源的持续可用性,并优化关键运营,而外部服务提供商可以帮助他们实现这些目标。
来源:Statista 数据中心支出文章和图表;JLL 数据中心报告。
在使用外部服务方面,数据中心和设施领导者拥有多种选择。他们可以使用托管服务和托管型数据中心服务,外包所有业务,从而专注于业务增长,免除 IT 管理的烦恼。或者,这些 IT 领导者也可以内部处理所有业务,从而开发数据中心运营这一竞争力。这便是超大型数据中心运营商的领域,他们会完善数据中心运营的各个方面,批量管理庞大的设施和全球网络。或者,IT 领导者可以借助其内部团队并与值得信赖的外部服务伙伴和供应商合作,共同规划、构建、运行、优化和拓展其 IT 覆盖区。以此让数据中心团队专注于战略管理,让服务伙伴承担关键运营职责。
大多数企业和中小型托管型数据中心组织可能会选择最后一种方法来处理其 IT 网络需求。在此场景中,IT 团队管理企业网络的部分或全部,同时利用外部资源提供有针对性的专业知识和服务,以扩大其覆盖范围并确保数据中心的高可用性和性能。例如,该 IT 团队可以与服务伙伴合作,规划和调试新设施、提供持续的预防性维护服务、升级和更换老旧设备,并获得持续的监控、维修和故障排除服务。
为何要制定服务计划?
答案很简单:您的组织正快速成长为数字化企业,而技术现正逐渐成为您所做一切的基础。您正在寻求实现以下一个或多个目标:
来源:AI Multiple 和 ZDNet
实现数字优先:您依靠高性能计算功能来帮助远程和现场员工与客户互动、推动数字产品和服务的开发,并为常规操作实现自动化。您正在采用比以往更多的云服务来加速这些数字化工作。随着分布式网络的扩展,您可能希望为订购或安装设备的方法实现标准化,或者计划在站点内外进行扩展。
利用数据:您的组织持有大量非结构化和结构化数据,您希望利用这些数据实现自动化、分析和其他目的。因此,您数据中心中的设备数量将急剧增加,并且会将计算设备放在前所未有的位置。这意味着从一开始就设置合适的功率和冷却方案比以往任何时候都更加重要。随着您添加越来越多的设备,您将与合作伙伴多次联系,确保您的电源和热管理方法可以扩展以满足新的要求。
保持可用性:您需要持续的网络连接和数据中心及边缘站点资源的可用性,以确保您的业务持续按预期运行。公司网络问题可能会损害团队的工作效率、损害客户体验并损失收入。因此,您需要随时监控设备状况,并进行预测性和预防性维护,以保持网络正常运行。
提高功率和冷却效率:在优化功率和冷却性能时,需要一丝不苟地对待超大型数据中心。企业和边缘计算站点管理者可能仍然需要优化方面的帮助,以降低成本并防止冷却性能不足或过冷。然而,如果利用 5G 的话,将为每个人增加网络密度,能源需求量将超过实际需求量的 3.5 倍。这意味着,许多人会向提供商寻求帮助,以寻找和部署更高效的可持续产品。例如,电信公司正在使用可再生能源为远程位置提供服务,并开始采用面向未来的能源管理方法。
来源:Uptime Institute Report 2021 年
管理日益扩大的覆盖区:正因为这些趋势,您的数据中心覆盖区正在不断扩大。它可能包括位于一个或多个区域的本地网络、托管型数据中心数据中心和边缘计算站点。您可能正在租赁、建造和配备新空间,以满足快速增长的需求,而且还需要项目方面的支持。或者还有可能,您正在所需的位置布置边缘计算站点,而前往这些站点可能并不可行或不理想。您希望与值得信赖的合作伙伴合作,他们可在您需要的时间和地点提供全天候支持,主动升级和更换系统,以保持业务正常运作。
服务伙伴应具备的关键素质
当前,您运行的任务关键型工作负载比以往任何时候都要多,因此您需要与能够提供恰当专业知识和服务组合的服务伙伴合作。您的服务伙伴将成为您保持站点持续安全运行的得力助手。此类公司应具有及时的响应性,并可全天候为某个地区,或多个地区甚至全球各地的站点提供服务。我们来详细了解一下数据中心团队正在寻找的服务能力。
来源:Vertiv 博客
丰富的专业知识:数据中心可能非常多样化,包括企业数据中心到托管服务、托管型数据中心和云数据中心。即使是网络或服务器机柜、模块化或迷你数据中心等边缘站点,也被视为关键的计算资源。虽然大多数位于陆地上,拥有方便、随时可用的电源,但其他计算资源可能位于海滨,甚至位于水面上,例如安装在石油钻井平台上。
您可能希望与能够为您的任何数据中心提供服务的服务伙伴合作,提供合适的专业知识和服务,帮助您充分利用关键机会,预测并解决挑战。服务提供商应该能够帮助您配备机房场地,定期测试和维护设备,并帮助优化性能。这样,您将降低风险以及运营成本。
对可靠性和安全的承诺:疫情更加凸显了数据中心团队可靠性和服务连续性的重要性。许多企业团队都转向以远程模式为主的方式来管理数据中心,同时依靠服务伙伴来提供其他服务。原始设备制造商 (OEM) 等必要服务提供商能够前往现场、安装和维修设备,并在企业团队无法前往这些地点时提供其他基本服务。
同时,OEM 正在为数据中心员工设计具有更佳用户体验 (UX) 的设备。这意味着要开发能够迅速轻松维护的设备、更容易获得可轻松维护的组件,并最终缩短平均维修时间 (MTTR)。此外,OEM 和数据中心团队必须考虑员工安全,因为员工和服务伙伴都在操作高压设备或在高压设备附近工作。
世界上最大的一些数据中心需要超过 100 兆瓦 (MW) 的电力,并接收和分配 480 伏的三相电力。将低压控制电路与高压电路相隔离的 OEM 设备可降低员工受伤的风险。在团队成员不愿意穿戴合格的个人防护设备 (PPE) 和防火服装的情境中,这一点尤为重要。
服务提供商应具有 90% 或以上的零件准时交付率,以确保每次事故的平均维修时间 (MTTR) 达到较佳水平。
快速响应时间:有时,尽管您尽了最大努力防止意外停机事故,但是依然会发生严重事故。现在,时间至关重要。数据中心停运事故造成的后果成本可能达数万美元到 1 亿美元以上。您需要迅速的专家支持,帮助您的数据中心重新上线。此时,您不会考虑服务提供商的小时费率!
为这一时刻做好准备的最佳方式便是未雨绸缪。在审查并挑选服务伙伴时,您需要考虑一些关键因素。这些因素包括提供商与您设施的距离以及响应时间。您的提供商还应具有保持大量全新原装零件现货库存的能力,以及执行常规固件升级的能力。此外,您还需要确保服务提供商的员工能定期接受培训,并确保公司采取了稳妥的安全政策,并能准确地对记录进行维护。
本地和全球覆盖:为数据中心和其他任务关键型设施实现标准化的服务方式、统一设备和合作伙伴,这将带来长期红利。您将能够确保获得一致的部署和维护方式,从而能够保护重要的设备和操作。您还将能够降低风险、提高可靠性、最大化成本和时间效率,并预测未来的服务和设备需求。
例如,一家多元化的健康保健公司打造了标准化热力预防性维护计划,为 39 家设施提供洁净室运营服务。这些洁净室用于药物配制操作,要求严格控制空气和温度以保持其完整性。通过标准化方法,公司避免了可能损害环境和产品的热力系统故障和温度波动,同时提高了设备采购、安装、升级和维护流程的效率。
数据中心团队需要的服务类型
项目服务
在启用新设施或启动新设备时,拥有行业经验和最佳实践知识可帮助您从一开始便正确执行项目。
设备安装: 您希望设置数据中心以取得成功。除了购买服务器、路由器、交换机和存储等 IT 设备外,您还需要选择合适的电源和冷却设备来保护这些设备。服务提供商可以提供设计工程服务,帮助您配置新设施或扩展现有设施。设计合适的直流电源系统并选择合适的不间断电源 (UPS) 系统,让您安心无忧。当市电断电时,UPS 系统是您的最后一道防线,因此谨慎选择它们非常重要。
在给电源系统通电之前,请开展独立的第三方测试保护您的投资。电力系统测试将帮助您验证设备或发现任何亟需在使用前解决的问题。
项目管理: 对数据中心项目进行设计、部署和调试是一个相互交织的漫长过程。服务伙伴将监督不同的项目,以确保数据中心如期上线,助您实现目标投资回报率 (ROI)。
启动服务: 当遇到紧急情况时,您需要迅速恢复。经验丰富的服务伙伴将提供设备以及全天候技术支持,并指派专门的项目经理,让您的系统或设施重新上线运行。服务伙伴将遵循您的灾难恢复计划,降低您的暴露风险,并帮助确保安全地重启运营。
来源:Vertiv 手册
预防性维护服务
网络中任何位置的电源故障都可能影响数据中心的运行,并对业务造成严重后果。预防性维护通过帮助您避免代价高昂的数据中心中断而收回成本。这些服务包括:
电池维护: 电池是导致数据中心停机的根本原因。通过维护计划主动管理电池可用性有助于降低这种风险来源。您将深入了解系统异常和报废趋势,并能够在电池故障出现之前、在备用电源系统出现危险之前更换电池。
直流电源服务: 定期预防性维护和主动更换关键的 UPS 组件和电池可大大降低电源事故期间出现故障的几率。经验丰富、经 OEM 培训的技术人员可提供电力预防性维护服务,包括操作检查、组件更换和提供综合报告。这些服务将最大限度地提高您电源系统可用性,甚至在停电、用电高峰、瞬态状态变化、线路噪音和其他电源相关问题中也是如此。
监控服务:您需要您的关键资产全天候 24 小时运作。远程工程师的持续监控和数据分析服务为您提供行业前沿的专业洞察并为您排除故障,无需增加额外人力。技术人员能够远程识别、诊断并修复影响到您关键设备的问题,之后再进行上报。借助监控服务,您可以享受主动响应服务,让您安心。
来源:Vertiv 白皮书
热管理:数据中心需要专门的热管理功能。服务提供商可以提供保修检查服务,以最大限度地提高精密冷却设备的性能、可用性和效率。训练有素的技术人员还可以实施预防性维护,为您提供所需的保修服务、部件、人工服务和紧急服务。优化服务将帮助您采取适当的控制措施、设定适当的设定点和配置,满足对容量和效率的更高需求。战略升级可帮助您延长设备的使用寿命并降低运营成本。最后,远程监控服务可确保您的关键业务网络受到全天候保护。
紧急服务: 事故发生后,需要迅速解决。合格的维修技术人员将排除故障、评估损坏状况、进行检查和测试、维修、调试设备和并安装备件。他们还将提供问题以及解决方式的详细报告,以防止将来再次发生类似情况。故障排除和维修服务能够保证快速恢复运行,控制风险和责任,减少返工以及工程变更通知单的数量。
来源:Vertiv 手册
短路和协调研究: 本研究评估系统的保护装置及其保护的电路,以确定设备在无损坏或故障的情况下可维持多久的运行时间。它有助于确保您为电源变压器、开关设备、变电站、电机控制中心、面板和其他设备提供足够的保护,以最大限度地减少过载和短路情况下的服务中断。
电源质量研究:这项研究可以识别接地问题和谐波失真等干扰源,并推荐解决方案以确保最佳系统性能。它可帮助运营商采用先进的流程控制措施和工业机械,从而提供更出色的电源质量,确保设备能平稳运行,并延长使用寿命。
电气基础设施评估:此评估是一项重要的工具,可帮助您保护 IT 投资。它将识别电气设备维护方面的差距,根据当前 IT 需求评估电气系统的设计,并展示提高 IT 系统可用性的方法并规划新的容量。您将获得详细的分析和明确的建议,以帮助您充分利用数据中心,改善电气设备的性能、维护状况,并改进操作。
数据中心效率评估:此评估基于行业最佳实践评估数据中心的可用性和效率,以确定优化机会。它专门评估冷却和电源架构的利用程度、冗余水平、已安装系统的效率、热点的存在位置、地板空间的利用率以及空气流通与散热。您将获得基于 ROI 计算结果的详细建议。这些建议将帮助您考虑并优先选择最佳选项,从而提高电源和冷却设备的性能、容量、可用性和效率。
可再生能源服务:电信运营商面临日益增加的网络接入和移动宽带需求。5G 只会加速这一增长趋势。因此,电信运营商正在采用混合能源管理方法。他们正在整合可再生能源,将服务扩展到难以接入电网的偏远地区。服务提供商可以提供项目服务来启动设施并为新设备供电,同时提供性能优化服务来优化能源使用。此外,服务提供商还可提供持续的维护服务,确保设备运行达到所需水平。
系统升级和替换
主动升级和更换关键电源设备可确保系统可靠性,防止代价高昂的停机。这些服务包括:
变速驱动器 (VSD) 升级:数据中心的负载需求会一直变化。但是,您的传统计算机机房空调 (CRAC) 系统的风扇速度和气流可能会保持不变,并可能设置为最大负载(很少存在)。通过 VSD 升级,您可以将电机速度与不断变化的负载需求相匹配。您将能够在不影响系统性能的情况下,将能源效率提高 50%。您热力设备的损耗将减少,同时可能每年将每个计算机空调单元 (CRAC) 的电力成本减少数千美元。
全组电容更换:您的 UPS 系统使用由直流电解型和交流聚合物薄膜电容器组成的大型电容器组,这些电容器组会随着时间推移而老化。服务提供商可以主动更换您的全组电容器,以实现较长的使用寿命,并避免意外停机。
EC 离心风机改装升级:电动换向 (EC) 风机是一种具有卓越价值的创新技术。EC 风机能够集成持续速度控制功能,从而在热管理装置的整个运行温度范围内进行管理,是一种简单、经济高效的节能技术。它可以调节气流,降低风机输入功率来节能。服务提供商可以升级 EC 风机,将风机功耗降低达 50%,为您节省数千美元的运营成本。
UPS 电池容量升级:主动维护您的 UPS 电池,这是您为确保系统可靠性并防止代价高昂的停机时间而可以采取的最经济高效的措施之一。服务提供商可以在维护系统时为您提供移动直流电源维修服务;安装、升级和替换设备;并对您的电池、UPS 装置和发电机进行预防性维护。此外,您的服务伙伴可以远程监控您的电池电压、电流和温度,并定期测试电池的内部电阻。
线上远程服务
管理多个站点的数据中心团队希望实现规模经济,即自动化流程、简化日常运营并提高成本效益。服务提供商可以提供远程服务,包括诊断、监控和远程系统恢复。这些服务可保持关键系统的正常运行,同时让您的数据中心团队完成更重要的工作,为客户带来更多价值。
远程监控和管理服务:服务提供商可以安排远程工程师持续监控并分析数据,从而快速、准确且安全地将设备恢复到其适当的运行状态。此类服务可提供特定警报状况原因的详细信息、识别潜在的未来问题,并提供性能趋势的信息,以改善基础设施管理。
例如,电信提供商需要在服务交付方面达到极高的标准。因此,他们需要获得整个网络运行状况的可见性。一家欧洲电信公司部署了实时基础设施监控和管理平台,将警报数量减少了 19%,同时将首次解决率提高了 92%。另一家移动网络运营公司,在警报减少方面取得了更为显著的进展,警报数量减少了 70%。这避免了不必要的维修拜访,同时优化了数据中心人员工作负载。
无线传感器网络:无线传感器网络可提供易于部署的平台,从而改善环境的可见性。借助这种可见性,数据中心团队可以覆盖更大的服务范围、降低部署成本、降低网络复杂性。借助专有的数据包验证、分层加密和用户批准要求,增强数据安全性。该网络还可与远程监控和管理工具集成,使团队借助单一用户界面即可监督系统。
资源
项目服务
预防性维护服务
专业和工程服务
系统升级和替换
线上/远程服务
为什么您应该做好最坏的打算
在数据中心的整个生命周期内与服务合作伙伴合作,有助于保护您免遭可能导致意外中断的常见问题:
灾难恢复:设施面临的风险包括飓风、洪水、火灾和地震等自然灾害,还有设施、工作人员、设备和数据受到的伤害。
拥有可靠的业务连续性和灾难恢复 (BC/DR) 策略和计划可能有一定的难度。此类计划应涉及如何自动将任务关键型工作负载转移到其他设备和站点(失效备援),以及提供分步指南,以持续监控数据中心的新风险。此外,在发生某些类型的事件时,您还应制定标准化的政策和程序。您是否安排了适当的工作人员以处理紧急事件? 他们能够安全地远程访问设备吗?您的供应商能否为您提供支持? 您的服务伙伴可以为您提供 BC/DR 检查清单,检查您当前的策略和计划,以弥补差距,定期测试您的设备,并进行定期审核。
例如,许多数据中心团队已为设备故障和天气问题做好准备,但却没有做好疫情应对准备。在疫情早期,团队纷纷建立安全的远程访问方式、制定人员配置应急计划,并支持供应链。现在,疫情已成为目前数据中心 BC/DR 计划的一部分。
电源中断:数据中心团队称,2020 年超过 56% 的停电事故造成的后果超过 10 万美元,其中 16% 的停电事故成本超过 100 万美元。来源:Uptime Institute,2021 年。然而,超大型数据中心或长期停电的成本显然可能高达数百万美元。除成本外,数据中心停电还会造成重大业务中断,为客户收入带来损失,并增加恢复成本。因此,利用主动式电源和冷却服务保护您的数据中心设备可能是您要进行的最佳投资之一。
冷却问题:随着处理密集型计算应用的不断增长,以及风冷技术的局限性,数据中心运营商正在评估液体冷却技术。到 2027 年,液体冷却市场将迅速增长到 65 亿美元,这是由于组织将采用更多的云服务、使用人工智能 (AI) 来推进高级分析和自动决策,并启用区块链和加密货币应用等。来源:Global Market Insights,2021 年 7 月。
服务提供商可以帮助您检查液体冷却技术,并知道您如何在数据中心中应用并扩展该技术。这可能涉及改装现有空间或设计新的数据中心,从而适应新的冷却技术。
液冷技术主要有两种类型:浸没式冷却,其中服务器和其他 IT 设备浸没在罐中的冷却液中;直接芯片冷却,其中冷却液直接送入数据中心设备的计算机芯片处,保持其低温运行。
结论
每家公司都需要构建独特的业务连续性蓝图,确保其关键基础设施可用、可持续且面向未来。
Vertiv 可为您的全球设施和基础设施构建连续性方案,确保您实现业务目标,并为客户和用户提供卓越的体验。
我们帮助您管理基础设施的整个生命周期,包括设计、构建、部署、管理、监控和维护。无论您身处何地,无论您的数据中心是何种型号、采用何种技术,我们的专业知识和全球影响力确保我们能提供始终如一的服务水平。
作为当前世界上大型的服务组织,Vertiv 拥有技术精湛的现场服务工程师和技术支持人员,他们在全球已成功实施 100,000 多个案例。他们吸收了广泛的知识、采用标准化流程和程序,使用 Vertiv 市场前沿的设备,为客户实现卓越成果。从规划到审批,依靠 Vertiv 帮助您成功管理项目;提高设备可用性和效率;监控和管理基础设施;在发生事故时迅速响应。
我们拥有良好的业绩记录,在确保设备可靠性和正常运行时间、降低总体拥有成本的同时,能开发减少能源使用量的创新解决方案,助您获益。
继续对话。