Skip to content
Snippets Groups Projects

Delete all references to DMTCP

Open Thomas Lynn Marcus requested to merge delete-dmtcp-entry into preview

As described and thoroughly tested here !765

DMTCP's usage is severely limited and cannot be recommended as a general solution:

nach meinem aktuellen Verständnis sind die Beschränkungen folgend:

  • DMTCP funktioniert für serielle und thread-parallele Anwendungen
  • DMTCP funktioniert für MPI-parallele Anwendungen nur, wenn diese auf nur einem Knoten ausgeführt werden
  • für MPI-parallele Anwendungen nutzt DMTCP scheinbar hydra, ein Plugin von mpiexec, was dann auch erklärt, warum ein Programmaufruf nur mit mpiexec und nur auf einem Knoten gelingt (srun nicht)

so weit der aktuelle Stand, folgende weiterführende Perspektiven sehe ich:

  • DMTCP selbst mal bauen, gucken ob damit Probleme lösbar wären
  • MANA (immer noch in der beta-Version) selbst bauen und ausprobieren
  • mit hydra mehr auseinandersetzen, vielleicht lässt sich damit noch mehr machen
  • ist das überhaupt ein Problem, das gelöst werden muss? diese Tools kommen und gehen, denn: Maintaining sehr aufwendig, viele Abhängigkeiten, sehr kompliziert, nicht genügend Geld dafür vorhanden

Bis weitere Recherchen unternommen sind, bin ich dafür, generische "Lösungen" für Checkpoint/Restart bei MPI-parallelen Programmen aus dem Wiki zu löschen.

Merge request reports

Checking pipeline status.

Approval is optional
Merge blocked: 1 check failed
Merge conflicts must be resolved.

Merge details

  • The source branch is 531 commits behind the target branch.
  • 1 commit and 1 merge commit will be added to preview.
  • Source branch will be deleted.

Activity

Filter activity
  • Approvals
  • Assignees & reviewers
  • Comments (from bots)
  • Comments (from users)
  • Commits & branches
  • Edits
  • Labels
  • Lock status
  • Mentions
  • Merge request status
  • Tracking
Please register or sign in to reply
Loading