Künstliche Intelligenz

IBM launcht Storage-Server für KI

Andy Patrizio arbeitet als freier Journalist für die Network World.
Laut dem Hersteller soll die neuen ESS-3500-Speichereinheit KI-Training um 70 Prozent schneller machen.
In Kombination mit dem DGX-Dense-Compute-System von Nvidia soll IBMs ESS 3.500 Storage Server KI-Trainingszeiten verkürzen.
In Kombination mit dem DGX-Dense-Compute-System von Nvidia soll IBMs ESS 3.500 Storage Server KI-Trainingszeiten verkürzen.
Foto: dotshock - shutterstock.com

IBMIBM hat das Portfolio seiner Spectrum Scale Enterprise StorageStorage ServerServer (ESS) erweitert. Die ESS-Familie zeichnet sich durch eine schnellere Controller-CPU und höheren Durchsatz aus. Die Geräte sind dafür konzipiert, mit Nvidias DGX Dense Compute Servern für KI-TrainingKI-Training zusammenzuarbeiten. Alles zu IBM auf CIO.de Alles zu Künstliche Intelligenz auf CIO.de Alles zu Server auf CIO.de Alles zu Storage auf CIO.de

Der neue ESS 3500 ist ein 2U-Design (8,9 Zentimeter dick) mit 24 Laufwerksschächten. Die maximale Rohkapazität beträgt 368 TB. Durch LZ4-Datenkomprimierung kann das Gerät jedoch bis zu 1 PB Speicherplatz erreichen. Frühere ESS-Versionen hatten diese Funktion nicht. Zudem erreicht das neue Modell eine Durchsatzleistung von bis zu 91 GB/s. Ältere Ausführungen kamen nur auf 80 GB/s.

Auf dem 3.500 läuft IBMs paralleles Dateisystem "Spectrum Scale", das sich über lokale, Cloud- und Edge-Netzwerke erstreckt. Es verwendet zwei aktive Controller mit entweder 100-Gbit-Ethernet- oder 200-Gbit-HDR-InfiniBand-Ports und einem 48-Kern-AMD-Epyc-Prozessor auf jedem Controller.

Der 3500 zielt darauf ab, die DGX-Dense-Compute-Systeme von Nvidia zu ergänzen, die zwar GPUs und Arbeitsspeicher, aber keinen Storage besitzen. Dazu kommt Nvidias GPUDirect Storage-Technologie zum Einsatz. Diese schafft einen direkten Datenpfad zwischen GPUs und Speicher über das Storage-Zugriffs- und Transportprotokoll NVMe oder NVMe over Fabrics (NVMe-oF).

Normalerweise müssen die Daten in die CPU und den Hauptarbeitsspeicher geladen werden, bevor sie zur Verarbeitung an die GPU weitergeleitet werden können. GPUDirect ermöglicht es dem System, die CPU und den Hauptspeicher zu umgehen und eine direkte Verbindung zwischen Storage und GPU-Arbeitsspeicher aufzubauen.

Laut Big Blue konnte der Autoteilehersteller Continental mit der Kombination aus IBM Spectrum Scale, ESS 3500 und Nvidia DGX die KI-Trainingszeit für selbstfahrende Fahrzeuge um bis zu 70 Prozent verkürzen. Der ESS 3500 ist ab sofort erhältlich. (jd)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Networkwold.com.

Zur Startseite