nächster Kurslauf

12. September - 24. Oktober 2022

KURSINFORMATIONEN

Themenbereiche

  • Datenanalyse, Künstliche Intelligenz: Eine Einführung
  • Konvergenz von HPC und Künstlicher Intelligenz
  • Exkurs: Container-Technologien
  • Explorative Datenanalyse
  • Exkurs: Nicht-Relationale Datenbanken
  • Maschinelles Lernen: Konzepte, Algorithmen und Evaluierung
  • Einführung in Neuronale Netzwerke
  • Big Data Architekturen und Frameworks
  • Trends und neuartige Technologien im Bereich HPC und AI

Übungen auf dem Trainingscluster der Supercomputing Akademie

  • Übung zu Container-Technologien
  • Übung zur explorativen Datenanalyse mit Tableau und Python
  • Übung zu Neuronalen Netzen mit TensorFlow
  • Übung zur Datenanalyse am Beispiel Stuttgarter S-Bahn Fahrzeiten

Die Übungen werden auf dem Trainingscluster des HLRS der Supercomputing Akadmie durchgeführt. Teilnehmer:innen erhalten dafür einen 24/7-Zugang zum Cluster über die gesamte Dauer des Kurses. Die Übung zu Container-Technologien wird udocker (Basistool für User zur Ausführung von Docker Containern) vorgstellt und verwendet.  50% der Übungen werden mit einem Jupyter Notebook auf dem Trainingscluster durchgeführt. Die Übung zur explorativen Datenanalyse sowie die Übung zu Neuronalen Netzen werden zudem über einen Container bearbeitet, sodass die Teilnehmer:innen sich Ihren Containern exportieren, die Übungen komfortabel mitnehmen und auf einem anderen Hostsystem (welches eine Software zur Container-Visualisierung installiert hat) problemlos ausführen können. Für die Übung zur Datenanalyse am Beispiel Stuttgarter S-Bahn Fahrzeiten wird Apache Spark (ein Framework für Cluster Computing) verwendet.

  • Sie können die Grundlagen der Datenanalyse und Künstlicher Intelligenz beschreiben und unterscheiden.
  • Sie können die Anforderungen von KI-Anwendungen auf HPC-Systemen aufzählen und erläutern.
  • Sie sind in der Lage, eine Explorative Datenanalyse durchzuführen.
  • Sie können erklären, was Big Data Architekturen und Frameworks sind.
  • Sie sind fähig, Deep Learning und Machine Lerning Frameworks zu unterscheiden und anzuwenden.
  • Sie können Trends und aktuelle Technologien im Bereich KI und HPC aufzählen und beschreiben.

 
Dennis Hoppe
High-Performance Computing Center Stuttgart (HLRS)
Head of Service Management & Business Processes
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Oleksandr Shcherbakov
High-Performance Computing Center Stuttgart (HLRS)
Service Management & Business Processes
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Li Zhong
High-Performance Computing Center Stuttgart (HLRS)
Service Management & Business Processes
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Sameed Hayat
High-Performance Computing Center Stuttgart (HLRS)
Service Management & Business Processes
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Dr.-Ing. Lorenzo Zanon
High-Performance Computing Center Stuttgart (HLRS)
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart

 
Darko Milakovic
High-Performance Computing Center Stuttgart (HLRS)
Communications & Industrial Trainings
Universität Stuttgart
Nobelstraße 19, 70569 Stuttgart
 

  • Entwicklungsingenieure
  • CAE-, Berechnungs- und Simulationsingenieure
  • System-Designer
  • Simulationsinteressierte

Linux

Da die vorgesehenen Übungen auf dem HLRS-Trainingscluster bereitgestellt werden, benötigen die Kursteilnehmer erweiterte Grundkenntnisse des freien Betriebssystems Linux. Die wichtigsten Konzepte und Werkzeuge von Linux wie

  • Shell und Shell-Befehle (→ sicherer Umgang mit der Kommandozeile),

  • Secure Shell (SSH-Verbindung zum Cluster herstellen),

  • den Umgang mit Dateien und Skripten (kopieren, verschieben, umbenennen),

  • die Struktur des Systems (Verzeichnisse wechseln),

  • die Benutzer- und Rechteverwaltung (wem eine Datei gehört und wer diese lesen, ändern und ausführen darf) und

  • das Erstellen/Modifizieren von einfachen (ggf. vorhandenen) Batch-Skripten mit einem Editor wie nano, vi oder emacs

sollten bekannt sein. Eine Anleitung zur Arbeit auf dem Trainingscluster wird zur Verfügung gestellt. Falls Sie bei sich in dieser Hinsicht noch Defizite feststellen, verweisen wir an dieser Stelle auf https://www.tuxcademy.org/product/lxes/.

Programmierkenntnisse

Vorkenntnisse in Python sind erforderlich. Von den Teilnehmer:innen wird vorausgesetzt,dass Sie zur Verfügung gestellten Beispielcodes lesen und modifizieren zu können. Alternativ verfügen die Teilnehmer über solide Programmierkenntnisse in einer anderen Programmiersprache (z.B. C/C++, Fortran oder Java) und sind dadurch in der Lage sich leicht in die Programmiersprache Python einzuarbeiten. Da Python verwendet wird, kann dieses Tutorial zum Erlernen der Syntax verwendet werden. Für die Übungen werden die Programmbibliotheken

für die Programmiersprache Python verwendet. Es wird empfohlen sich bereits vorab mit diesen Bibliotheken und deren Methoden vertraut zu machen. Erste Erfahrungen im Umgang mit Jupyter Notebooks sind ebenfalls erforderlich. Da Jupyter Notebooks verwendet werden, kann dieses Tutorial genutzt werden, um sich damit vertraut zu machen.

Umgang mit herkömmlichen Office Programmen

Um sich Datensätze anzuschauen, wird der Umgang mit einem Tabellenkalkulationsprogramm (z.B. Microsoft Excel, LibreOffice Calc) vorausgesetzt.

  • Rechner mit ssh-Zugang zum Trainingscluster (mit ssh-Key).

    • Ggf. muss Software installiert werden. Dafür notwendige Rechte müssen vorhanden sein.

    • Netzverbindungen nach außen zu fremden Clustern müssen aufgebaut werden können.

  • Software: Mozilla Firefox/ Google Chrome Browser

  • Eine stabile Internetverbindung für das Bearbeiten der Lerninhalte und Übungen wird empfohlen.

  • Zugang zu Videokonferenz-Tool mit Kamera und Mikrofon (ein Headset wird aus Qualitätsgründen empfohlen).

Der Zeitaufwand pro Modul beträgt insgesamt 60 Stunden bei wochenweise freier Zeiteinteilung sowie feste Termine für virtuelle Seminare (abends) und Prüfung (tagsüber). Die Dauer erstreckt sich über 6 Wochen mit einem ungefähren wöchentlichen Aufwand von 10 Stunden.

Sie lernen in einem komfortablen und effektiven Mix aus Präsenz- und Onlinelehre und erwerben so HPC-Fähigkeiten auf höchstem Niveau. Ergänzt werden die Online-Phasen durch regelmäßige Online-Meetings im virtuellen Klassenraum. Bei freier Zeiteinteilung wenden die Teilnehmerinnen und Teilnehmer das Gelernte in Übungen auf dem Trainingscluster an. Die Fachexperten des HLRS, welche die Lerneinheiten entwickelt haben, stehen in wöchentlichen virtuellen Seminaren für Fragen zur Verfügung. Ein Forum ermöglicht den fachlichen Austausch der Teilnehmerinnen und Teilnehmer untereinander.

Für die Teilnahme an dem Modul erhalten Sie vom Höchstleistungsrechenzentrum Stuttgart eine Teilnahmebestätigung. Wenn Sie zudem sämtlich Lerninhalte des Moduls bearbeitet, regelmäßig an den virtuellen Seminaren teilgenommen und die Lernaufgaben fachgerecht beantwortet haben, erhalten Sie eine qualifizierte Teilnahmebestätigung.

Sie erhalten ein Zertifikat, wenn Sie die Voraussetzungen für die qualifizierte Teilnahmebestätigung erfüllen und die Abschlussprüfung des Moduls bestehen. Mit der erfolgreichen Prüfung weisen Sie nach, dass Sie Kompetenzen erworben haben, das erlernte Wissen selbständig anzuwenden.

Haben Sie Fragen? Wir sind für Sie da.

Darko Milakovic

Modulleitung

Tel +49 (0) 711 / 685-87294