HPC-CLUSTER - AUFBAU & BETRIEB

19. April - 31. Mai 2021

High Performance Computing (HPC) heißt hohe und höchste Rechenleistung zu erzielen. Dazu werden spezielle HPC-Cluster und Supercomputer verwendet. Um maximale Leistung zu erzielen, müssen alle beteiligten Komponenten optimiert werden: Hardware, Software und die verwendeten numerische Methoden. In diesem Modul konzentieren wir uns auf die Hardware und den Betrieb dieser Rechner.

anmelden

MODULINFORMATIONEN

  • IT-Administratoren
  • IT-Verantwortliche
  • Informatiker
  • IT-Interessierte

 

 

Inhaltliche Themenbereiche

 

  • Was ist HPC? Hardware und Herausforderungen
  • Rechenknoten
  • Storage
  • Dateisysteme
  • Netzwerketheorie und -technologien
  • Betriebssysteme für Cluster
  • Software System & Anwendung
  • Software-Releasemanagement
  • Benchmarks
  • Technische Integration in die Organisation
  • Betriebskonzepte
  • Monitoring
  • Batch-Systeme
  • Usermanagement und Accounting
  • IT-Sicherheit

 

 

Zu erlangende Kompetenzen

 

  • Sie erhalten einen Einblick in die Architektur moderner CPUs und lernen wichtige Konsequenzen für die Anwender und Entwickler von Software kennen.
  • Sie verstehen Produktbeschreibungen aktueller CPUs und können die Herstellerangaben interpretieren.
  • Sie lernen die Grundlagen zu Datenspeichern und Dateisystemen.
  • Sie lernen unterschiedliche Typen von Dateispeichern kennen, wie man sie in Speicherverbünden verbindet und welchen Speicherbereichen sie zugeteilt werden.
  • Sie werden unterschiedliche Speichernetzwerke kennenlernen, sowie die Vor- und Nachteile von parallelen Dateisystemen und die Partitionierung von Speicherbereichen für unterschiedliche Datengruppen.
  • Sie erlernen die Terminologie und Grundlagen zur Beschreibung von Netzwerken und können diese anwenden.
  • Sie erhalten einen Überblick über die aktuell wichtigsten Netzwerktopologien und -technologien. Weiter lernen sie wie sie wichtige Charakteristika eines Netzwerks mittels Benchmarks bestimmen können.
  • Sie lernen HPC-Anforderungen an das Betriebsystems und Besonderheiten gegenüber PC-Betriebssystemen kennen.
  • Sie installieren einen Compiler auf einem Cluster und erfahren, wie man Versionen und Patches mit dem Modul-System organisiert.
  • Sie erfahren, wie man einen Benchmark plant und durchführt.
  • Sie lernen die wesentlichen Aspekte von Lizenzen und die Funktionsweise von Lizenzservern kennen.
  • Sie erfahren Grundlegendes über die Anforderungen, die ein HPC-Cluster an die technische Infrastruktur stellt.
  • Sie erhalten eine Übersicht über die relevanten Themenfelder, damit Sie in Ihrer eigenen Planung keine wichtigen Aspekte vergessen.
  • Sie können nachvollziehen, weshalb Überwachung ein wesentlicher Teil des Clusterbetriebs ist.
  • Sie lernen die verschiedenen Möglichkeiten einer solchen Überwachung sowie die Vielfalt der dafür nötigen Werkzeuge und ihre Unterschiede kennen.
  • Sie werden in der Lage sein, den Grad der Überwachung unter Abwägung der durch die Überwachung entstehenden Leistungsverluste gegenüber dem Gewinn an Informationen einzuschätzen.
  • Sie lernen die Grundlagen der IT-Sicherheit kennen.
  • Sie lernen die Stride-Methode zur Angriffsanalyse kennen.
  • Sie erstellen eine Bedrohungslandkarte für eine HPC Umgebung.
  • Sie lernen Sicherheitsmaßnahmen kennen. Sie können Zertifizierungen und Regulatorien einordnen.
  • Sie verstehen, wie IT Ressourcen in Großrechner-Umgebungen verwaltet, Zugriff für Benutzer auf diese geregelt und die Planung und Ausführung verteilter Anwendungen ermöglicht werden.
  • Sie lernen die Unterschiede zwischen den Komponenten eines Batch-Systems, Resource Manager und Job-Scheduler, sowie ihr Zusammenspiel kennen.
  • Sie bekommen einen Überblick über aktuelle Software-Lösungen und eine Zusammenstellung wichtiger Beispiele für die Nutzung von Batch-Systemen.
  • Sie bekommen ein Gesamtbild, welche Überlegungen beim Aufsetzen einer Nutzerverwaltung anstehen sowie welche Art von Komponenten in eine Nutzerververwaltung und ins Accounting integriert werden können.

 

 

Ihre Referenten

 

 
Dr. Norbert Conrad
High-Performance Computing Center Stuttgart (HLRS)
Deputy Director
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Dr.-Ing. Martin Bernreuther
High-Performance Computing Center Stuttgart (HLRS)
Parallel Computing - Training & Application Services
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart
 

 
Christoph Niethammer
High-Performance Computing Center Stuttgart (HLRS)
Scalable Programming Models & Tools
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart
 

 
Dr.-Ing. Thomas Bönisch
High-Performance Computing Center Stuttgart (HLRS)
Head of Project & User Management, Accounting
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart
 

 
Manuela Wossough
High-Performance Computing Center Stuttgart (HLRS)
Project & User Management, Accounting
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Jochen Buchholz
High-Performance Computing Center Stuttgart (HLRS)
Project & User Management, Accounting
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart
 

 
Tünde Erdei
High-Performance Computing Center Stuttgart (HLRS)
Numerical Methods & Libraries
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Dr. Anja Beyer-Peters
Dr. Anja Beyer-Peters
Senior Security Consultant, CISSP
Generation Secure

 

Empfohlenes Vorwissen

 

Linux

Die Kursteilnehmer besitzen erweiterte Grundkenntnisse des freien Betriebssystems Linux und Kenntnisse in Linux-Anwendung. Der Hintergrund von Linux sowie die wichtigsten Konzepte und Werkzeuge von Linux wie die

  • Shell und Shell-Befehle (→sicherer Umgang mit der Kommandozeile),

  • Secure Shell,

  • den Umgang mit Dateien und Skripten,

  • die Struktur des Systems,

  • die Benutzer- und Rechteverwaltung und

  • das Erstellen von einfache Batch-Skripten mit einem Editor wie nano, vi oder emacs.

sollten bekannt sein. Eine Anleitung zur Arbeit auf dem Trainingscluster wird zur Verfügung gestellt.

Falls Sie bei sich in dieser Hinsicht noch Defizite feststellen, verweisen wir an dieser Stelle auf https://www.tuxcademy.org/product/lxes/

Umgang mit herkömlichen Office Programmen

Ein sicherer Umgang mit einem Tabellenkalkulationsprogramm (z.B. Microsoft Excel, LibreOffice Calc) und Textverarbeitungsprogramm (z.B. Microsoft Word, LibreOffice Wirter).

Umgang mit Plot-Tools

Ein sicherer Umgang mit einem Programm zur grafischen Darstellung von Messdaten und mathematischen Funktionen sowie der Umgang mit CSV-Dateien wird benötigt.

Grundlegendes Hardwareverständnis

Die Teilnehmer verstehen wie die Hardware eines klassischen Computers aufgebaut ist. Das beinhaltet vor allem das grundlegende Verständnis von

  • Prozessoren (CPU),

  • Arbeitsspeichern (RAM-Speicher) und

  • Verbindung zwischen diesen beiden Komponenten,

  • Netzwerktechnik,

  • Festplatten und

  • Rechenbeschleuniger.

 

 

Technisches Equipment und Einstellungen

 

  • Rechner mit ssh-Zugang zum Trainingscluster (mit ssh-Key).

    • Ggf. muss Software installiert werden. Dafür notwendige Rechte müssen vorhanden sein.

    • Netzverbindungen nach außen zu fremden Clustern müssen aufgebaut werden können.

  • Eine stabile Internetverbindung für das Bearbeiten der Lerninhalte und Übungen wird empfohlen.

  • Zugang zu Videokonferenz-Tool mit Kamera und Mikrofon (ein Headset wird aus Qualitätsgründen empfohlen).

 

Moduldauer und Lernaufwand

 

Der Zeitaufwand pro Modul beträgt insgesamt 60 Stunden bei wochenweise freier Zeiteinteilung sowie feste Termine für virtuelle Seminare (abends) und Prüfung (tagsüber). Die Dauer erstreckt sich über 6 Wochen mit einem ungefähren wöchentlichen Aufwand von 10 Stunden.

 

Blended Learning

 

Sie lernen in einem komfortablen und effektiven Mix aus Präsenz- und Onlinelehre und erwerben so HPC-Fähigkeiten auf höchstem Niveau. Ergänzt werden die Online-Phasen durch regelmäßige Online-Meetings im virtuellen Klassenraum. Bei freier Zeiteinteilung wenden die Teilnehmerinnen und Teilnehmer das Gelernte in Übungen auf dem Trainingscluster an. Die Fachexperten des HLRS, welche die Lerneinheiten entwickelt haben, stehen in wöchentlichen virtuellen Seminaren für Fragen zur Verfügung. Ein Forum ermöglicht den fachlichen Austausch der Teilnehmerinnen und Teilnehmer untereinander.

 

Qualifizierte Teilnahmebestätigung

 

Für die Teilnahme an dem Modul erhalten Sie vom Höchstleistungsrechenzentrum Stuttgart eine Teilnahmebestätigung. Wenn Sie zudem sämtlich Lerninhalte des Moduls bearbeitet, regelmäßig an den virtuellen Seminaren teilgenommen und die Lernaufgaben fachgerecht beantwortet haben, erhalten Sie eine qualifizierte Teilnahmebestätigung.

 

Abschluss mit Zertifikat

 

Sie erhalten ein Zertifikat, wenn Sie die Voraussetzungen für die qualifizierte Teilnahmebestätigung erfüllen und die Abschlussprüfung des Moduls bestehen. Mit der erfolgreichen Prüfung weisen Sie nach, dass Sie Kompetenzen erworben haben, das erlernte Wissen selbständig anzuwenden.

Mit der Anmeldung beim Newsletter bleiben Sie stets auf dem neuesten Stand.

Newsletter

Haben Sie Fragen? Wir sind für Sie da.

 
Darko Milakovic

Modulleitung

kontakt@supercomputing-akademie.de

Ihre Nachricht an uns

Kontaktformular
* = Pflichtfelder