MUST

 

Laufzeit-Fehlererkennung für Parallelanwendungen

MUST Logo

Das Marmot Umpire Scalable Tool (MUST) ist eine Laufzeit-Fehlererkennungsanwendung, die automatisch nicht standardkonforme Nutzung von MPI erfasst. MUST wird der Zielapplikation vorgeschaltet und fängt deren MPI-Aufrufe ab. Es kontrolliert auf lokale und nicht lokale Korrektheitsfehler, wie etwa Fehler im Punkt-zu-Punkt-Datentypabgleich oder Verklemmungen. Es vereint die Funktionen von Marmot und Umpire, bietet aber gleichzeitig drastisch erhöhte Skalierbarkeit und ist als Open-Source-Software verfügbar.

MUST erkennt:

  • Unzulässige Argumente
  • Ressourcenverwendungsfehler und –lecks
  • Tatsächliche und potentielle Verklemmungen
  • Datentyp-Abgleichungsfehler
  • Überlappungen in Kommunikationspuffern

Zurzeit bietet MUST ein umfangreiches Angebot an Korrektheitsprüfungen, wo Überprüfungen für groß-skalige Programmläufe möglich sind. Dafür stellen wir eine Open-Source-Basisinfrastruktur, die Generic Tool Infrastructure (GTI), zur Verfügung. Sie verringert viele Hürden in der HPC-Toolentwicklung und erlaubt die schnelle und effiziente Spezifikation von skalierbaren HPC-Tools. Darüber hinaus bietet GTI Methoden die Laufzeitanalyse zu beenden, während die Zielanwendung abstürzt.

Quelltexte und Dokumentation zu MUST und GTI sind in unserem Dokumentationsportal in englischer Sprache verfügbar.