Daten: Management und Analyse

23. September - 14. Dezember 2020

Die Analyse großer Mengen unstrukturierter Daten erfordert ausgefeilte Methoden der Datenanalyse, man spricht auch von Smart Data Analytics. Um aus Big Data, also riesigen Datenströmen Ereignismuster und Zusammenhänge abzuleiten, sind Höchstleistungsrechner in vielen Fällen die geeignete Technologie.

Daten: Management und Analyse

Das Modul Daten: Management und Analyse besteht aus zwei Themenbereichen.: 

Der erste Themenbereich "Management" enthält eine Einführung in das Thema Daten und macht Sie mit den Grundlagen vertraut. Das Team von Dr. Thomas Bönisch (HLRS) führt Sie zudem durch die technischen Grundlagen, Ontologie und Modelldesign von Metadaten und Methoden und Tools zum Umgang mit Daten in Repositorien. Abschließend wird auf die Themen Dunkle Daten und Datenverantwortlichkeit eingegangen. 

Im zweiten Themenbereich präsentiert Ihnen das Team von Dennis Hoppe (HLRS) wie sie mittels künstlicher Intelligenz und HPC große Datenmengen analysieren können. Dazu lernen Sie aktuelle Container-Technologien, Datenbank-Technologien und explorative Datenanalyse kennen. Zum Abschluss lernen Sie Grundlagen des maschinellen Lernens, mit welchem Sie in Neuronale Netzwerke und „Deep Learning“-Anwendungen eingeführt werden, sowie die neusten Trends aus dem Bereichen KI und HPC.

Das Modul Daten: Management und Analyse

Dieses Modul befindet sich noch in Vorbereitung und die Inhalte sind daher noch Änderungen unterworfen.

Zielgruppe
 

  • Administratoren
  • IT-Verantwortliche
  • Informatiker
  • IT-Interessierte

Inhalte
 

  • Einführung und Überblick zu Daten
  • Grundlagen des Datenmanagements
  • Ontologien und Modelle von Metadaten
  • Methoden und Tools zum Umgang mit Repositorien
  • Datenverantwortlichkeit bezüglich Dunklen Data
  • Datenanlyse und KI
  • Explorative Datenanalyse
  • Anforderungen von KI-Anwendungen auf HPC-Systemen
  • Big Data Architektur und Frameworks
  • Zukünftige Trends und Technologien

Voraussetzungen und technisches Vorwissen
 

Es werden allgemeine HPC-Kenntnisse und Grundkenntnisse in Rechner-Hardware vorausgesetzt. Des Weiteren sind ein solides Fundament für den Einsatz des freien Betriebssystems Linux und vertiefte Kenntnisse in Linux-Anwendung und –Administration erforderlich. Der Hintergrund von Linux und freier bzw. Open-Source-Software sowie die wichtigsten Konzepte und Werkzeuge von Linux wie die Shell, den Umgang mit Dateien und Skripten, die Struktur des Systems und die Benutzer- und Rechteverwaltung sollten bekannt sein. Außerdem sind Grundkenntnisse in der Anmeldung mit einer Secure Shell, Shell-Befehle und das Erstellen von einfache Batch-Skripten mit einem Editor wie nano, vi/vim oder emacs vorausgesetzt.

Zeitaufwand


Der Zeitaufwand pro Modul beträgt rund 125 Stunden über einen Zeitraum von 13 Wochen. Er verteilt sich auf:

  • wöchentlich ca. 10 Stunden für Selbststudium, darin ein wöchentliches Online-Meeting (montagabends)
  • zwei Präsenztage in Stuttgart

Kosten


Das Weiterbildungsangebot wird vom Europäischen Sozialfonds und vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg gefördert und befindet sich in der Entwicklung. Daher findet der erste Durchlauf in einer Beta-Version statt. Die Teilnahme ist für die erste Lerngruppe kostenlos.

Modulhandbuch


Ausführliche Informationen zur Supercomputing-Akademie und das Modul "Daten: Managemt und Analyse" finden Sie im Modulhandbuch.

Themen, die darin unter anderem erläutert werden:

  • Das Weiterbildungsprogramm im Überblick
  • Organisatorische Rahmenbedingungen
  • Schwerpunktmodul Daten: Management und Analyse