Innowacja AWS: Chłodzenie cieczą IRHX dla centrów danych AI i GPU Nvidia Blackwell

Photo of author

By maciekx

Rosnące zapotrzebowanie na sztuczną inteligencję (AI) przesunęło granice tradycyjnej infrastruktury centrów danych, zwłaszcza w zakresie zarządzania temperaturą. W obliczu bezprecedensowego poziomu ciepła generowanego przez procesory graficzne AI nowej generacji firmy Nvidia, Amazon Web Services (AWS) proaktywnie odpowiedział na to kluczowe wyzwanie, opracowując specjalnie zaprojektowany system chłodzenia cieczą. Ten strategiczny krok nie tylko zapewnia optymalną wydajność dla najbardziej wymagających obciążeń AI, ale także podkreśla zaangażowanie AWS w umacnianie swojej pozycji lidera w konkurencyjnym krajobrazie przetwarzania w chmurze.

  • AWS opracowało autorski system chłodzenia cieczą, nazwany In-Row Heat Exchanger (IRHX).
  • System IRHX został zaprojektowany, aby sprostać intensywnemu ciepłu generowanemu przez procesory graficzne AI nowej generacji Nvidia.
  • Jest on kluczowym elementem nowych instancji P6e AWS, wykorzystujących platformę Nvidia GB200 NVL72, integrującą 72 procesory Blackwell GPU w jednej szafie.
  • Inwestycja ta wpisuje się w szerszą strategię Amazonu polegającą na pionowej integracji kluczowych komponentów infrastruktury.
  • W pierwszym kwartale 2025 roku AWS odnotowało najwyższą w swojej historii marżę operacyjną, znacząco przyczyniając się do zysków Amazona.
  • Nowe rozwiązanie wzmacnia konkurencyjną pozycję AWS w obszarze infrastruktury AI, czyniąc ją bardziej wydajną i skalowalną.

Innowacyjne Rozwiązania Chłodzenia dla AI

Tradycyjne systemy chłodzenia powietrzem okazały się niewystarczające dla intensywnych obciążeń termicznych generowanych przez nowoczesne akceleratory AI. Uznając to ograniczenie, AWS zaprojektował Wymiennik Ciepła In-Row (IRHX), własne rozwiązanie chłodzenia cieczą, przeznaczone dla centrów danych o wysokiej gęstości. System ten cyrkuluje schłodzoną ciecz bezpośrednio obok szaf serwerowych, skutecznie odprowadzając ciepło od gęsto upakowanych procesorów graficznych. Według Dave’a Browna, wiceprezesa ds. usług obliczeniowych i uczenia maszynowego w AWS, konwencjonalne podejścia do chłodzenia uznano za nieopłacalne ze względu na ich nieefektywność w wykorzystaniu przestrzeni i zużyciu wody, zwłaszcza w skali wymaganej przez AWS.

P6e i Integracja Systemu IRHX

Ta zaawansowana infrastruktura chłodzenia jest integralną częścią nowo wprowadzonych instancji P6e AWS, które wykorzystują platformę Nvidia GB200 NVL72 – potężny system superkomputerowy integrujący 72 procesory Blackwell GPU w jednej szafie. Instancje te zostały specjalnie zaprojektowane, aby sprostać wymagającym potrzebom obliczeniowym dużych modeli AI i aplikacji generatywnej sztucznej inteligencji. Dzięki bezpośredniemu wbudowaniu systemu IRHX w architekturę centrum danych, AWS uniknął potrzeby kosztownego modernizowania, zapewniając, że te klastry GPU o wysokiej gęstości utrzymują optymalne temperatury pracy dla ciągłej wydajności. Ta integracja zapewnia klientom AWS dostęp do najnowocześniejszej infrastruktury do trenowania uczenia maszynowego, umożliwiając deweloperom i badaczom trenowanie znacznie większych modeli AI ze zwiększoną szybkością i efektywnością.

Strategia Pionowej Integracji i Przewaga Konkurencyjna

Rozwój systemu IRHX jest zgodny z szerszym strategicznym imperatywem Amazonu, polegającym na internalizacji kluczowych komponentów infrastruktury. AWS poczynił znaczne inwestycje w projektowanie własnych chipów, rozwiązań pamięci masowej oraz sprzętu sieciowego dla swoich usług chmurowych. Ta strategia pionowej integracji ma na celu zmniejszenie zależności od zewnętrznych dostawców, optymalizację wydajności operacyjnej i bardziej efektywne zarządzanie kosztami. Skuteczność tego podejścia jest widoczna w wynikach finansowych AWS, które w pierwszym kwartale 2025 roku odnotowało najwyższą marżę operacyjną, umacniając swoją pozycję jako głównego motoru napędowego ogólnej rentowności Amazonu.

Ta wewnętrznie opracowana innowacja w zakresie chłodzenia dodatkowo umacnia pozycję lidera AWS w rozwoju infrastruktury chmurowej. Główne firmy technologiczne, w tym Microsoft z własnymi chipami AI i systemem chłodzenia Sidekicks, a także Google i Meta, podobnie inwestują w dostosowane rozwiązania sprzętowe dla obciążeń AI. Jednakże AWS posiada wyraźną przewagę konkurencyjną: rozległą globalną sieć centrów danych i dziesięciolecia niezrównanego doświadczenia we wdrażaniu niestandardowego sprzętu na ogromną skalę. Integracja IRHX ma na celu dalsze wzmocnienie infrastruktury AWS przygotowanej na AI, czyniąc ją bardziej wydajną, zrównoważoną i skalowalną na przyszłe potrzeby.


newsblog.pl