Новые чипы для ИИ Nvidia Blackwell при объединении в серверы страдают от перегрева

3 дней назад 10

Nvidia уже несколько раз пыталась решить проблему

Поставки ускорителей для ИИ Nvidia Blackwell сталкиваются с новыми проблемами. Как сообщается, адаптеры перегреваются. 

Новые чипы для ИИ Nvidia Blackwell при объединении в серверы страдают от перегрева фото: WCCF Tech

Серверы на основе таких GPU уже поставляются, и первые клиенты столкнулись с проблемами перегрева, из-за чего они опасаются перебоев с поставками, из-за которых у них не будет достаточно времени для запуска новых центров обработки данных. 

Сообщается, что графические процессоры Blackwell перегреваются при их объединении в серверные стойки, рассчитанные на установку до 72 чипов. Речь о старшей модели серверов — Blackwell NVL72. Именно на него Nvidia делает основную ставку, и именно он наиболее интересен крупным клиентам. 

По словам сотрудников Nvidia, которые работали над этой проблемой, а также клиентов и поставщиков, осведомленных о ней, производитель чипов несколько раз просил своих поставщиков изменить конструкцию стоек, чтобы решить проблему перегрева. Однако это пока не помогло. 

Вполне вероятно, что Nvidia снова ограничит поставки таких решений пока полностью не устранит проблему. Напомним, чипы Blackwell потребляют огромное количество энергии: до 1 кВт на один GPU.  

18 ноября 2024 в 21:11

Автор:

| Теги: Nvidia

| Источник: The Information, WCCF Tech

Читать всю статью