Podczas międzynarodowej konferencji ISC High Performance 2024 odbywającej się w dniach 12–16 maja br. w Hamburgu zostały ogłoszone nowe listy TOP500 i Green500 – najszybszych i najefektywniejszych energetycznie superkomputerów na świecie. Najszybszą maszyną obliczeniową w Polsce został Helios z Akademickiego Centrum Komputerowego Cyfronet AGH. Po raz pierwszy w historii polskiej informatyki aż cztery superkomputery z jednego ośrodka – ACK Cyfronet AGH – znalazły się na prestiżowej liście TOP500. Ponadto Helios zajął trzecie miejsce na liście Green500 – najefektywniejszych energetycznie superkomputerów. Dotychczas żaden polski system nie uplasował się tak wysoko.
Superkomputery umożliwiają wykonanie w ciągu kilku godzin lub dni obliczeń, które przy użyciu pojedynczych komputerów zajęłyby wiele lat. Helios będzie realizować rocznie kilkaset projektów badawczych dla naukowców z całej Polski, m.in. z zakresu chemii, fizyki, inżynierii materiałowej, energetyki, medycyny, biologii oraz sztucznej inteligencji. Został zbudowany w ramach projektu realizowanego dzięki Programowi Operacyjnemu Inteligentny Rozwój. Jego moc obliczeniowa może zostać wykorzystana komercyjnie także przez gospodarkę.
ACK Cyfronet AGH od 2021 r. jest liderem Narodowego Centrum Kompetencji HPC w ramach międzynarodowego projektu prowadzonego przez Wspólne Przedsięwzięcie EuroHPC, którego celem jest budowa kompetencji z zakresu obliczeń i sztucznej inteligencji oraz ułatwienia dostępu do zasobów obliczeniowych jednostkom naukowym, administracji publicznej i przedsiębiorstwom, ze szczególnym naciskiem na małe i średnie przedsiębiorstwa (MŚP) i startupy. Jednym z mechanizmów wsparcia MŚP są krótkie projekty typu Proof-of-Concept, które będą realizowane na Heliosie i mają zademonstrować możliwości wykorzystania superkomputerów w biznesie.
Helios posiada 35 PFLOPS teoretycznej mocy obliczeniowej, ponad 108 tysięcy rdzeni obliczeniowych, 460 TB pamięci operacyjnej i 18 PB pojemności systemów dyskowych, które łącznie oferują wydajność niemal 2 TB/s. Jego instalacja zakończyła się w grudniu 2023 r. w wyniku prac realizowanych w koordynowanym przez Cyfronet projekcie Narodowa Infrastruktura Superkomputerowa dla EuroHPC – EuroHPC PL. Superkomputer został zbudowany według projektu Cyfronetu przez Hewlett-Packard Enterprise w oparciu o platformę HPE Cray EX4000 i składa się z trzech partycji obliczeniowych:
Wszystkie komponenty superkomputera połączone są ze sobą siecią Slingshot o prędkości 200 Gb/s. Platforma HPE Cray EX4000, w oparciu o którą zbudowano Heliosa, jest także używana w budowie najszybszych superkomputerów na świecie (Frontier) oraz w Europie (LUMI). Partycje CPU i GPU systemu są chłodzone cieczą, dzięki czemu możliwe jest osiągnięcie bardzo niskiego wskaźnika PUE (Power Usage Effectiveness), a w efekcie zwiększenie jego efektywności energetycznej i obniżenie kosztów eksploatacji. Dodatkowo odzyskane w ten sposób ciepło może być wykorzystane do ogrzewania.
Helios zadebiutował na liście TOP500 w listopadzie 2023 r., kiedy jego partycja CPU znalazła się na 291. miejscu ze wstępnym wynikiem testów wydajności. W obecnej edycji listy system znajduje się aż na dwóch pozycjach. Partycja GPU Heliosa ulokowała się na 55. miejscu, a partycja CPU na 305. Podział na dwie osobne pozycje jest spowodowany chęcią zaprezentowania pełni możliwości każdej z partycji obliczeniowych dzięki wykorzystaniu specjalnie zoptymalizowanych wersji benchmarków, powstałych jako efekt współpracy ekspertów Cyfronetu z HPE, NVIDIĄ i AMD. Moc obliczeniowa Heliosa odpowiada prędkości ok. 50 000 współczesnych laptopów, czyli mocy obliczeniowej całkiem dużego miasta.
Ogromnym sukcesem jest otrzymanie wyniku pomiaru efektywności energetycznej partycji GPU Heliosa, który ulokował go na trzecim miejscu listy Green500. Jednocześnie warto zauważyć, że systemy z Niemiec i Wielkiej Brytanii na pozycjach poprzedzających polski superkomputer są od niego znacznie mniejsze. Oznacza to, że Helios jest najbardziej efektywnym energetycznie superkomputerem z pierwszej setki listy TOP500. Efektywność energetyczna jest obecnie jedną z najważniejszych metryk używanych do oceny nowych superkomputerów, gdyż bezpośrednio wpływa na koszty eksploatacji takich maszyn, które potrzebują ogromnej ilości mocy elektrycznej – w przypadku najszybszych komputerów na świecie jest to nawet 30 MW, co przekłada się na ogromne roczne koszty prądu. Tak wysoka efektywność energetyczna oznacza, że Helios oferuje więcej mocy obliczeniowej za każdą skonsumowaną kilowatogodzinę niż mniej efektywne systemy, a więc obliczenia z jego wykorzystaniem są nie tylko tańsze niż w przypadku innych maszyn, ale także w mniejszym stopniu wpływają na środowisko.
Na liście TOP500 znalazło się osiem superkomputerów z Polski (w nawiasach teoretyczna moc obliczeniowa):
# 55 – Helios GPU (30,44 PFLOPS) – ACK Cyfronet AGH,
# 76 – Proxima (23,32 PFLOPS) – PCSS IChB PAN,
# 80 – Lem (20,37 PFLOPS) – WCSS PWr,
# 154 – Kraken-Fregata (10,02 PFLOPS) – CI TASK PG,
# 177 – Athena (7,71 PFLOPS) – ACK Cyfronet AGH,
# 250 – Altair (5,88 PFLOPS) – PCSS IChB PAN,
# 305 – Helios CPU (3,35 PFLOPS) – ACK Cyfronet AGH,
# 444 – Ares (3,51 PFLOPS) – ACK Cyfronet AGH.
Dostęp do większości superkomputerów z powyższej listy, jak również do najszybszego superkomputera w Europie, jest zapewniany za pośrednictwem infrastruktury PLGrid.