Рост генеративного ИИ упирается не только в новые чипы, но и в гораздо более приземленную проблему — тепло. Чем мощнее серверы, тем больше энергии уходит на их охлаждение, а вместе с этим растут расходы дата-центров и нагрузка на электросети.
Стартап Ferveret, основанный выходцами из MIT, предлагает необычное решение: охлаждать серверы по принципам, которые десятилетиями изучались для ядерных реакторов. Компания утверждает, что ее система помогает экономить электричество, не расходует воду и позволяет получать больше полезной работы от тех же мощностей.
Почему охлаждение стало большой проблемой для ИИ
Современные модели ИИ обучаются и работают на огромных кластерах графических процессоров и специализированных ускорителей. Эти чипы потребляют много энергии и выделяют столько тепла, что обычные вентиляторы уже становятся слабым звеном.
По оценкам, к концу десятилетия дата-центры могут потреблять от 9% до 17% всей электроэнергии в США. При этом значительная часть энергии внутри дата-центров уходит не на вычисления, а на охлаждение оборудования.
Для индустрии ИИ это критично. Если оператор дата-центра тратит слишком много электричества на отвод тепла, у него остается меньше мощности на запуск моделей, обучение нейросетей и обработку запросов пользователей.
Жидкость вместо вентиляторов
Решение Ferveret основано на погружном охлаждении. Сервер помещают в специальную жидкость, которая забирает тепло намного эффективнее воздуха.
Принцип простой: жидкость лучше переносит тепло, чем воздушный поток от вентилятора. Когда жидкость частично закипает у горячей поверхности чипа, она забирает еще больше энергии за счет фазового перехода — то есть перехода из жидкого состояния в пар.
Но у кипящего охлаждения есть сложность: пузырьки пара нужно контролировать, конденсировать обратно в жидкость и удерживать систему в стабильном режиме. Ferveret пытается решить эту задачу с помощью технологии Adaptive Phase Cooling, или APC.
Главная идея — маленькие пузырьки
Ключевое отличие разработки Ferveret — поведение пузырьков на поверхности сервера. В системе стартапа они получаются меньше и быстрее отделяются от горячей поверхности.
Это важно, потому что после отделения пузырька жидкость снова касается нагретой зоны и забирает новую порцию тепла. Чем быстрее идет этот цикл, тем эффективнее охлаждается чип.
Компания адаптировала подход, известный в ядерной инженерии как subcooled boiling. Если объяснять просто, это режим, при котором жидкость может закипать у горячей поверхности, но пузырьки быстро снова превращаются в жидкость в более холодной окружающей среде.
Еще один важный момент: Ferveret заявляет, что использует жидкость с низкой температурой кипения и без токсичных PFAS. Эти вещества часто называют «вечными химикатами», потому что они плохо разлагаются и могут накапливаться в окружающей среде.
Модульный формат для существующих дата-центров
Многие системы погружного охлаждения выглядят как большие резервуары, куда помещают серверы. Такой подход может быть эффективным, но его сложно внедрять в уже работающую инфраструктуру.
Ferveret выбрала более компактный формат. Ее система поставляется в виде небольших модулей, где каждый блок рассчитан на один сервер и может устанавливаться в стойку.
По задумке компании, это упрощает обслуживание и делает технологию более удобной для операторов дата-центров. Им не нужно полностью перестраивать объект под гигантские ванны с жидкостью.
ПО управляет охлаждением в реальном времени
Ferveret продает не только «коробку» с жидкостью. В систему входят стойки, блоки распределения охлаждения, датчики давления и температуры, а также программное обеспечение.
Софт следит за состоянием каждого модуля и регулирует условия работы, чтобы система тратила меньше энергии. Это особенно важно для AI-нагрузок, где потребление мощности может быстро меняться в зависимости от типа вычислений.
Компания также говорит о системе управления питанием серверов. Она помогает оптимизировать работу оборудования так, чтобы дата-центр получал больше вычислений на тот же объем электроэнергии.
Больше токенов на каждый ватт
В исследовании, проведенном вместе с кафедрой компьютерных наук Калифорнийского университета в Лос-Анджелесе, Ferveret сообщила о 15-процентном улучшении вычислительной энергоэффективности по сравнению с современными жидкостными системами охлаждения.
Если объединить охлаждение APC с системой управления питанием, компания оценивает выгоду еще выше: дата-центр может получать до 35% больше токенов при том же энергопотреблении.
Токены — это небольшие фрагменты текста или данных, с которыми работают языковые модели. Проще говоря, чем больше токенов система выдает на каждый ватт, тем эффективнее работает инфраструктура ИИ.
Почему это важно для отрасли
ИИ-индустрия быстро сталкивается с ограничениями по электричеству и воде. Новые дата-центры сложно строить там, где не хватает энергомощностей или ресурсов для охлаждения.
Технологии вроде Ferveret могут изменить географию вычислительной инфраструктуры. Если дата-центр не нуждается в воде для охлаждения, его проще размещать рядом с солнечной энергетикой в засушливых регионах.
Это может быть важно для США, Ближнего Востока, Африки и других регионов, где много солнца, но не всегда есть доступ к большим объемам воды. Для ИИ это означает возможность масштабироваться без такого сильного давления на местные ресурсы.
Кто уже тестирует технологию
Ferveret уже проверяет свои решения с несколькими компаниями. Среди них CleanSpark, оператор и разработчик дата-центров, FuriosaAI, производитель AI-ускорителей, и Switch, один из крупных операторов дата-центров в США.
Стартап также участвует в программе Nvidia Inception, которая поддерживает технологические компании на ранних стадиях. Ferveret ведет переговоры с крупными облачными провайдерами и планирует расширять партнерства.
Если технология подтвердит эффективность в промышленных масштабах, она может стать частью новой волны инфраструктуры для ИИ — более плотной, мощной и менее зависимой от воды.
От ядерной физики к устойчивому ИИ
История Ferveret показывает, как идеи из одной высокотехнологичной отрасли переходят в другую. Основатели стартапа сначала занимались теплопередачей в ядерных реакторах, а теперь применяют эти знания к самым горячим чипам индустрии ИИ.
Для дата-центров будущего вопрос охлаждения становится таким же важным, как выбор процессоров или источника энергии. Чем лучше отрасль научится отводить тепло, тем больше вычислений сможет выполнять без непропорционального роста потребления ресурсов.
