The page you're viewing is for Russian (EMEA) region.

Мониторинг температуры стойки: секрет для комфортных условий работы оборудования в ЦОД

В серверах, безусловно, есть определенные возможности вентиляции и самоохлаждения, но мы бы не назвали их «теплокровными». Каждое повышение температуры окружающей среды на -17,2 °C приводит к повышению средней температуры процессора на -17,2 °C. Другими словами, существует четкая корреляция между температурой ЦОД и температурой оборудования стойки.

Когда именно это становится проблемой? Это зависит от оборудования, но большинство ЦП подвержены риску расплавления, если серверу разрешено работать при температуре от 30 до 35 °C дольше нескольких минут.

В большинстве ЦОД стремятся к более низкой температуре окружающей среды, как правило, в соответствии с рекомендуемым ASHRAE диапазоном 18–27 °C (на отклонение влияют такие факторы, как влажность и точка росы). Этот диапазон, очевидно, ниже точки невозврата для ЦП, однако температуру в современных ЦОД высокой плотности сложно назвать статичной в различных стойках. Горячие точки, вызванные недостатками воздушного потока и другим деструктивными условиями, могут привести к изолированным случаям перегрева критически важного оборудования.

Кроме того, температура в ЦОД определяется не только тем, что происходит в настоящее время, но и тем, что может произойти. В истории много ужасных случаев сбоя прецизионных кондиционеров (CRAC), приводящих к опасным колебаниям температуры. И да, работа серверов при более высоких температурах более эффективна; это экономит деньги и снижает воздействие на окружающую среду. Однако при работе ближе к периферии в случае отказа CRAC температура будет подниматься до опасного уровня гораздо быстрее.

Это не значит, что не следует отговаривать руководителей ЦОД от использования оборудования при более высокой температуре. Скорее, следует побудить их к поддержке оперативной визуализации температуры, чтобы быстро реагировать при обнаружении признаков превышения безопасных пороговых значений. Если оборудованию в ЦОД станет некомфортно, оно не будет жаловаться. Оно просто завершит работу, а критически важные операции станут недоступными.

Используйте мониторинг температуры в режиме реального времени

ASHRAE рекомендует устанавливать не менее шести датчиков температуры на стойку. Три из них будут расположены спереди (в верхней средней и нижней части) и три — сзади для контроля температуры воздуха на входе и выходе. Для создания более точных моделей температуры и воздушного потока, которые настоятельно рекомендуются для центров обработки данных, работающих при температуре 26,6 °C, на объектах высокой плотности часто используется более шести датчиков на стойку.

Почему? Простой ответ — потому что вы не можете найти горячую точку, если не видите ее. Система мониторинга температуры в режиме реального времени, подключенная к сети ЦОД, уведомит назначенных сотрудников с помощью SNMP, SMS или электронной почты о превышении безопасного температурного порога.

И опять же, чем больше датчиков, тем лучше. Очень приятно осознавать, что у вас всегда под рукой будет система оповещения в режиме реального времени. Еще лучше иметь возможность взглянуть на компьютерную модель с данными от множества стоечных датчиков, чтобы можно было отследить причину отклонения.

Не позволяйте серверам замерзнуть

Намного меньше менеджеров ЦОД озабочены тем, что их температура ниже, чем средняя, учитывая, что выделяется больше тепла. Однако падение температуры ниже 18,3 °C становится рискованным по другой причине.

В низких температурах в воздухе может удерживаться меньше влаги. Следовательно, высокая относительная влажность в низкотемпературной среде приведет к конденсации. И, как большинство из нас знают из уроков физики пятого класса, вода и электричество совсем не дружат. Влага может быстро и необратимо вывести процессор и материнскую плату сервера из строя.

Таким образом, важно рассматривать температуру ЦОД как уравновешивающее действие. Если допускать падение температуры без учета других факторов окружающей среды, а именно влажности и точки росы, возникнет необоснованный риск для вашего оборудования. Падение температуры ниже 18,3 °C почти никогда не обосновано. Последнее, что необходимо для повышения коэффициента энергоэффективности (PUE) — это энергия, потребляемая для охлаждения вашего объекта при температуре ниже рекомендуемой.

Чтобы избежать ситуации, когда серверы «мерзнут», убедитесь, что вы дополнили температурные мониторы сетью датчиков влажности и точки росы. При согласовании с датчиками температуры руководители предприятий будут в режиме реального времени получать уведомления о том, что относительная влажность или температура достигают уровня, при котором возникает риск конденсации. И наоборот, если уровни влажности слишком низкие, воздух может стать достаточно сухим для образования электростатических разрядов, что может повредить чувствительные электронные компоненты.

Да, критически важное оборудование для ЦОД требует серьезного технического обслуживания. Это, вероятно, никогда не изменится. Но благодаря комплексному мониторингу центров обработки данных вы будете точно знать, что нужно вашим серверам в тот или иной момент.

Язык и регион