Memory Tracking per Job
Idee: Plugin von Collectd, welches Memory Usage aus den cgroup ermittelt
- Memory Usage aus JOB_ID wird auf den ersten HWThread des jeweilgen Jobs geschrieben
- InfluxDB bekommt neue Memory Measurement, die als Tag noch zusätzlich CPU bekommt
Beispiel:
CPUSET: cat /sys/fs/cgroup/cpuset/slurm/uid_2089086/job_18091882/cpuset.cpus
MEM: cat /sys/fs/cgroup/memory/slurm/uid_2089086/job_18090429/memory.kmem.max_usage_in_bytes ???