SHENZHEN, China, 17. Oktober 2023 — “Ich muss diese Aufgabe wirklich erledigen, um meinen Termin einzuhalten. Die Wartezeit für Ressourcen ist viel zu lang. Was soll ich tun?”
“Mein Experiment-Deadline ist nächste Woche, aber ich habe gerade bemerkt, dass einige Daten falsch waren. Es wird mehr als 100 Stunden dauern, die Simulation erneut laufen zu lassen. Kann es schneller gehen?”
“Dieses Experiment ist für mich so wichtig. Der Termin kommt schnell näher. Werde ich in der Lage sein, meine Aufgabe zuerst auszuführen?”
Was wissenschaftliche Forscher nicht nur beschäftigt, sind molekulare Bewegung, DNA-Zusammensetzung, Windkanaltests und komplexe Modellierungs- und Simulationsexperimente, sondern auch die Notwendigkeit, begrenzte Computing-Ressourcen zu verwalten und sich um lange Wartezeiten zu kümmern.
Um die Effizienz von HPC zu verbessern und die Kosten der wissenschaftlichen Forschung zu senken, organisierte die öffentliche HPC-Plattform der Peking Universität eine Anbieterbewertung, um ein HPC-Netzwerk auszuwählen, das ihren Erwartungen gerecht wird. Das intelligente verlustfreie HPC-Netzwerk von Huawei belegte aufgrund seiner unübertroffenen Rechenleistung den ersten Platz.
Ein Rechenzentrum mit bemerkenswerten Leistungen
Die Peking Universität war Vorreiter bei der Einrichtung eines Rechenzentrums an Universitäten in China, als sie 1963 ihren ersten Computer kaufte. 2001 gründete sie mit Experten aus verschiedenen Bereichen das Zentrum für Computersimulation und -technik. Dieses Zentrum ist als eine multidisziplinäre Forschungsplattform positioniert, die dem universitären Lehrbetrieb und der Forschung dienen kann. 2018 wurde die öffentliche HPC-Plattform eingeweiht und schrittweise wurden drei Cluster – Weiming Nr. 1, Weiming Lehr-Nr. 1 und Weiming Biowissenschaften Nr. 1 – in Betrieb genommen. Die Gesamtzahl der Computing-Kerne auf der öffentlichen Plattform erreichte 31.732 und die Spitzenrechenleistung 3,65 PFLOPS. Die Plattform stellte eine HPC-Umgebung für eine Reihe von Disziplinen wie Mathematik, Mechanik, Physik, Chemie, Biologie und Geologie bereit.
Eine solide Grundlage für die wissenschaftliche Forschung
Eine HPC-Plattform fungiert als ein wichtiger Support für die wissenschaftliche Forschung einer Universität. Bis zum 12. Mai 2023 hatte die HPC-Plattform der Peking Universität 5070 Nutzer in 96 Fakultäten. Die Plattform hat mehr als 545 Forschungsprojekte mit einem Gesamtfonds von CNY 3,136 Milliarden unterstützt und über 1400 hochwertige Papiere. Sie unterstützte auch die Veröffentlichung des Gordon Bell Awards im Jahr 2020. Dieses preisgekrönte Projekt verbesserte die Simulationsgrenze der Molekulardynamik. Es ermöglichte die Simulation von bis zu 100 Millionen Atomen mittels maschinellem Lernen, was verblüffend war. Dies gilt als einer der bedeutendsten Durchbrüche, die bisher auf dem Gebiet der Computersimulation erzielt wurden.
Höhere Rechenanforderungen machen den Netzwerkaufbau dringend erforderlich
Da die Zahl der Nutzer auf der Plattform weiter zunimmt, überschreitet die Betriebsarbeit allmählich ihre oberen Grenzen. Dies hat zu einem beispiellosen Durchsatz- und Komplexitätsniveau der Netzwerkinfrastruktur geführt. Als Beispiel: Die Auslastung der Knoten von Weiming Biowissenschaften Nr. 1 lag lange Zeit über 95%. Ihre maximale Auftragsbetriebszeit beträgt 109 Stunden und die maximale Wartezeit 550 Stunden. Es ist klar, dass der Umbau des Systems und des Netzwerks dringend erforderlich ist.
Um diese Probleme zu lösen, schlugen die Anbieter vor, verlustlose Netzwerktechnologien wie InfiniBand (IB), RoCEv1 und RoCEv2 zu verwenden. Nach strengen Tests entschied sich die öffentliche HPC-Plattform der Peking Universität schließlich für die intelligente verlustfreie HPC-Netzwerklösung CloudFabric 3.0 von Huawei aufgrund ihrer unübertroffenen Leistung. Basierend auf einem intelligenten verlustfreien HPC-Netzwerk ist diese Lösung ideal für den Aufbau von HPC-Clustern, die 100% der Rechenleistung freisetzen und die Auftragsbetriebs- und Wartezeiten minimieren können.
Das intelligente verlustfreie HPC-Netzwerk von Huawei hilft der Peking Universität, die Effizienz der wissenschaftlichen Forschung zu verbessern
Die Tests konzentrierten sich auf die Leistung von TCP/IP, IB und RoCEv2 in verschiedenen Anwendungsszenarien, einschließlich des HPC-Benchmarktesttools LINPACK, des Community Earth System Model (CESM) und der Molekulardynamik-Software Virtual Analogue Switching Point (VASP).
Im VASP-Test übertraf das intelligente verlustfreie HPC-Netzwerk 100GE RoCEv2 von Huawei IB. In den LINPACK- und CESM-Tests bot das 100GE RoCEv2 von Huawei im Wesentlichen die gleiche Leistung wie IB. All dies bewies, dass das intelligente verlustfreie HPC-Netzwerk von Huawei IB in realen Anwendungsszenarien ersetzen kann.
Die intelligente verlustfreie HPC-Netzwerklösung von Huawei ermöglicht einzigartig den verlustfreien Ethernet. Verglichen mit dem herkömmlichen Ethernet kann der verlustfreie Ethernet bei gleicher Servergröße die Rechenleistung verdoppeln. Ein weiteres Merkmal der Lösung ist der CloudEngine 16800 Switch. Dieser leistungsstarke Switch bietet die weltweit höchste Dichte von 768 x 400GE-Ports und eignet sich ideal für den Aufbau eines 10E-Level-Ultra-Large-Compute-Clusters. Darüber hinaus ist Huawei der einzige Anbieter, der in-network computing (INC) implementiert, d.h. netzwerkunterstütztes Rechnen. Wie von Tolly bestätigt, ist die Job Completion Time (JCT) der Lösung von Huawei 17% kürzer als bei IB.
Die HPC-Plattform der Peking Universität verfügt über den führenden Supercomputer-Cluster in ganz China. Die LINPACK-Effizienz des gesamten Systems rangiert kontinuierlich auf Platz eins, was extrem hohe Anforderungen an die Netzwerkleistung und -zuverlässigkeit stellt. Diese Tests beweisen erneut, wie leistungsstark das hyperkonvergente DCN von Huawei ist und helfen Huawei, mehr Anerkennung aus der Supercomputing-Branche zu gewinnen. In Zukunft wird das intelligente verlustfreie HPC-Netzwerk von Huawei in verschiedenen Bereichen wie Bildung und wissenschaftlicher Forschung breiter angewendet, was eine solide Grundlage für wissenschaftliches Rechnen, technologische Innovation und hochwertige wissenschaftliche Forschung schafft.
Dieser Artikel wurde aus der Smart Education Issue der ICT Insights Zeitschrift ausgewählt. Sie sind herzlich eingeladen, die offizielle Website von Huawei zu besuchen, um mehr zu erfahren:
https://e.huawei.com/de/ict-insights/global/ict_insights/ict34-intelligent-education
Kontakt
hwebgcomms@huawei.com