Ein Turbolader für den Supercomputer JUWELS

The J眉lich supercomputer JUWELS Credit: Forschungszentrum J眉lich/Ralf-Uwe Limbach

Der Jülicher Supercomputer JUWELS wird einen großen Bruder haben, ein sogenanntes Booster-Modul, wie das Forschungszentrum Jülich, Atos und ParTec vereinbart haben. Das mit mehreren tausend Grafikprozessoren bestückte Modul ist für extreme Rechenleistung und Aufgaben der Künstlichen Intelligenz ausgelegt. Es wurde als deutsch-französisches Projekt zusammen mit NVIDIA und Mellanox im Co-Design-Prozess entwickelt. Mit der Markteinführung des Boosters im Jahr 2020 wird die Rechenleistung von JUWELS von derzeit 12 auf über 70 Petaflops erhöht. Das entspricht 70 Billionen Rechenoperationen pro Sekunde oder der Leistung von mehr als 300.000 modernen PCs – Rechner in Europa rechnet derzeit schneller.

Der „Jülich Wizard for European Leadership Science“, kurz JUWELS, folgt dem neuartigen Prinzip der in Jülich entwickelten modularen Supercomputing-Architektur. So lassen sich unterschiedliche Module, die auf unterschiedliche Anforderungen zugeschnitten sind, mit einer einheitlichen Systemsoftware zusammenführen und zu einem einzigen, hochflexiblen Supercomputer vernetzen.

Das erste Modul, das sogenannte Cluster-Modul, besticht durch seine Vielseitigkeit und einfache Handhabung. Es ging 2018 in Betrieb und war von vornherein für die Erweiterung mit zusätzlichen Modulen ausgelegt. Das mit Abstand größte dieser Module ist das kommende, mit Grafikprozessoren ausgestattete Booster-Modul, mit dem große Datenmengen und besonders rechenintensive Programmteile mit maximaler Effizienz parallel verarbeitet werden können攆oder beispielsweise für groß angelegte Simulationen oder maschinelles Lernen .

Als das erste Modul von JUWELS installiert wurde, waren noch nicht alle Komponenten auf dem Markt verfügbar, die zum Bau des Boosters benötigt wurden. Damit diese neue Erweiterung gebaut werden kann, stehen nun alle Teile zur Verfügung, die für ein ausgewogenes High-Performance-Computing-Modul erforderlich sind.

Neues Supercomputer-Konzept aus J眉lich

„Die modulare Supercomputing-Architektur ermöglicht es, die besten verfügbaren Technologien flexibel und kompromisslos zu integrieren“, erklärt Prof. Thomas Lippert, Direktor des Jülich Supercomputing Center (JSC). „Modularität ist unsere Antwort auf die immer komplexer und heterogener werdenden Anforderungen, die Anwendungscodes an Supercomputer stellen. Sie ermöglicht uns eine kostengünstige Realisierung von Exascale und wird sogar die Integration exotischer Zukunftstechnologien wie Quantencomputer ermöglichen.“

Als nächster großer Schritt im Bereich High Performance Computing (HPC) wird weltweit der Bau eines Exascale-Rechners verfolgt. Mit einer Billion (10^18) Rechenoperationen pro Sekunde ist ein solcher Computer mindestens eine Größenordnung leistungsfähiger als die derzeit schnellsten Supercomputer.

Die Idee des modularen Supercomputing wurde von Lippert konzipiert und unter der Leitung von Dr. Estela Suarez, JSC, gemeinsam mit ParTec in den EU-geförderten Forschungsprojekten DEEP und DEEP-ER mit Hilfe vieler europäischer Partner aus Forschung und Industrie umgesetzt . „Der JUWELS Booster ist wegweisend für die Entwicklung eines europäischen Exascale-Systems, denn er lässt Europas führende Rolle im Bereich der Systemarchitektur zum Tragen“, sagt Bernhard Frohwitter, CEO von ParTec.

Hardwarepartner aus Europa, Israel und USA

Der JUWELS Booster basiert auf der BullSequana XH2000 Supercomputerserie von Atos. „Ausgestattet mit unseren neuesten leistungsstärksten beschleunigten Blades bietet die BullSequana-Plattform Jülich die effektivste Recheninfrastruktur auf unserem Weg in Richtung Exascale. Sie unterstützt auch Jülichs Engagement für eine nachhaltige Entwicklung mit unserer patentierten Direct Liquid Cooling-Warmwasserlösung.“ sagte Agn猫s Boudot, Senior Vice President, Head of HPC & Quantum bei Atos.

Einzigartig am modularen JUWELS-System ist, dass es sich gleichermaßen für anspruchsvollste Aufgaben im Bereich Simulation und Machine Learning, also Künstliche Intelligenz, eignet und beide Bereiche problemlos kombinieren kann. „JSC nutzt unsere GPUs der nächsten Generation für Rechenzentren im Booster-Modul von JUWELS, um diese Anforderungen mit höchster Energieeffizienz zu erfüllen“, sagt Marc Hamilton, VP, Solutions Architecture and Engineering, NVIDIA.

Die für den modularen Computer erforderliche extrem hohe Netzwerkleistung kommt von Mellanox. „Unsere 200 Gb/s HDR InfiniBand-Technologie bietet einen weltweit führenden Datendurchsatz und extrem niedrige Latenzzeiten und liefert eine Netzwerkleistung, die der Rechenleistung der Rechenknoten des JUWELS Boosters entspricht. Darüber hinaus ermöglichen die flexiblen adaptiven Routing- und Steuerungsfunktionen JUWELS den Betrieb als vereinheitlichter modularer Supercomputer”, sagte Gilad Shainer, SVP für Marketing bei Mellanox Technologies.


Leave a Comment