Publikation

Coupling turbulent boundary layer flow simulation with a transformer

  • Kopplung turbulenter Grenzschichtsimulation mit einem Transformer

Hilgers, Tom; Müller, Matthias S. (Thesis advisor); Meinke, Matthias (Thesis advisor); Orland, Fabian (Consultant); Hübenthal, Fabian (Consultant)

Aachen : RWTH Aachen University (2026)
Masterarbeit

Masterarbeit, RWTH Aachen University, 2025

Kurzfassung

Gegenwärtige Bemühungen zur Reduzierung von Treibhausgasemissionen im Luftfahrtsektor umfassen die Erforschung von Methoden zur aktiven Verringerung des Luftwiderstands (ADR). Die Bewertung von ADR Methoden erfordert jedoch rechenintensive Computational Fluid Dynamics (CFD)-Simulationen der widerstandserzeugenden turbulenten Grenzschicht (TBL). Diese hohen Rechenkosten habenjüngste Versuche motiviert, die Simulationen durch maschinelles Lernen (ML) zu beschleunigen. In vorangegangenen Arbeiten wurde ein Transformer-Modell für diese Aufgabe vorgestellt, eine prototypische Kopplung mit dem Multiphysik-Solver m-AIA vorgeschlagen und eine modulare Fortran-basierte Schnittstelle entwickelt. In dieser Arbeit implementieren wir eine vollständige Kopplung zwischen m-AIA und dem Transformer, indem wir die Fortran-basierte Schnittstelle in C++ neu entwickeln. Dadurch ermöglichen wir eine flexible Verbindung von modernen CFD Solvern mit ML Modellen, die je nach Bedarf mit den Kopplungsbibliotheken PhyDLL oder AIxeleratorService genutzt werden kann. Mit beiden Bibliotheken erreichen wir eine nicht stagnierende Skalierbarkeit und hohe parallele Effizienz, wobei der AIxeleratorService die niedrigsten absoluten Laufzeiten liefert. Um die Effizienz auf modernen heterogenen Clustern zu maximieren, erweitern wir den AIxeleratorService um die Inferenzarbeit auf die verfügbaren CPU- und GPU-Ressourcen zu verteilen. Wir entwickeln ein formales Modell zur Bestimmung der optimalen Arbeitsverteilung und validieren unseren Ansatz experimentell, wobei wir nahezu optimale Ergebnisse erzielen, mit Leistungs- und Energieffizienz gewinnen die mit der Anzahl der pro GPU zugewiesenen CPU skalieren. Außerdem führen wir eine ganzheitliche Bewertung des Transformers für seine vorgesehene Aufgabe durch. Wir stellen fest, dass geringe konventionelle Fehler erhebliche physikalische Ungenauigkeiten verdecken, die sich negativ auf die Lösung des gekoppelten Solvers auswirken. Unsere Architekturanalyse zeigt grundlegende Einschränkungen auf und schlägt Verbesserungen sowie alternative Modelle vor. Um zukünftige Entwicklungen zu beschleunigen, implementieren wir eine modulare Trainingspipeline und demonstrieren deren Leistungsfähigkeit durch das Training eines Prototypmodells.

Einrichtungen

  • Lehrstuhl für Hochleistungsrechnen (Informatik 12) [123010]