- Untersuchung von Transfer Learning zur Vorhersage von I/O Zeiten verschiedener Systeme
Voß, Adrian; Müller, Matthias S. (Thesis advisor); Kunkel, Julian (Thesis advisor); Liem, Radita Tapaning Hesti (Consultant)
Aachen : RWTH Aachen University (2024)
Masterarbeit
Masterarbeit, RWTH Aachen University, 2024
Kurzfassung
Die Transition von Petascale zu Exascale Systemen erfordert mehr denn je, dass die HPC Forschung I/O Performance untersucht, um sowohl Anwendungsentwickler als auch Systembesitzer darin zu unterstützen, die bestmögliche Leistung zu erreichen. Zusätzlich zum Verhalten verschiedener Anwendungen kommen hierbei Stauungseffekte, globales I/O Wetter und Systemrauschen ins Spiel. Jüngste Resultate wie [6] und [5]von Isakov et al. demonstrieren, dass Machine Learning basierte Modellierung ein viel versprechendes Werkzeug ist um diese Komplexität zu bewältigen. Andererseits benötigt der Ansatz von Isakov et al. große Mengen an Trainingsdaten, weshalb Dmytro Povaliaev in seiner Masterarbeit [15] einen Transfer Learning Ansatz vor-schlägt. Durch diese bisheringe Arbeiten motiviert zeige ich einen neuartigen DeepDive Workflow, der es erlaubt, die Qualität der Vorhersagen eines Modell auf der Ebene von einzelnen Anwendungen oder sogar niedriger zu analysieren. Zusätzlicher mögliche die Integration von Explainable AI Algorithmen dem Anwender diese Workflows detaillierte Einsichten in die I/O Muster, welche das Modell gelernt hat. Unter Einsatz dieses Workflows demonstriere ich, dass mein Modell in der Lage ist, die Zeit die weithin genutzte HCP Applikationen mit I/O verbringen mit einer Genauigkeit vorherzusagen, welche von Experten in dieser Domäne wie auch System-besitzern als praxistauglich angesehen wird. Zuletzt ermöglicht es mein Workflow auch, unzureichende Vorhersagen zu isolieren und durch ein Fine Tuning des Modells zu verbessern.
Einrichtungen
- Fachgruppe Informatik [120000]
- Lehrstuhl für Hochleistungsrechnen (Informatik 12) [123010]