Infrastructure
DGX A100 (2021)
FH-Aachen
Wir betreiben 2 DGX A100 Systeme, welche jeweils 8 Nvidia A100 GPUs mit jeweils 40GB VRAM haben.
Die Server stehen im Rechenzentrum der FH Aachen in der Goethestraße und ermöglichen die Nutzung für KI-Workload, sowie größere Datenverarbeitungs-Aufgaben.
Perspektivisch werden diese auch für den FH-weiten JupyterHub allen zur Verfügung gestellt.
Seit 2026 wird eines der beiden Systeme mit Proxmox betrieben um durch die Virtualisierung zusätzliche Flexibilität zu erhalten.
File-Server
FH-Aachen
Durch das KI@FH-Aachen Forschungsprojekt wurde ein File-Server mit einer Speicherkapazität von 400TB eingerichtet.
Um eine erhöhte Datensicherheit und Ausfallsicherheit zu gewährleisten werden die Server als redundante Ceph-Knoten betrieben. Das verteilte Dateisystem Ceph kann mit dem Ausfall von einem der 3 Datei-Server umgehen.
In jedem Server sind 16 TB SSDs, sowie 8 2TB SSDs verbaut, welche die verschiedenen Anforderungen an Geschwindigkeit und Speichermenge erfüllen können.
Um die verfügbare Rechenleistung auszulasten, wird das Cluster auch als Hyper-Converged Infrastructure (HCI) betrieben, so dass die Hosts auch den ausfallsicheren Betrieb von Server-Ressourcen (VMs) ermöglichen.
MX 7000 Compute-Cluster
FH Aachen
Das Compute-Cluster stellt zusätzliche Rechenleistung bereit und ist ebenfalls an das File-Server Proxmox-Cluster angebunden.
Durch die Integration von flächendeckend mindestens 10G ist eine ausreichende Geschwindigkeit gewährleistet um Compute-VMs einzurichten, welche ihren Storage über das Netzwerk auf den File-Servern halten.
Dadurch kann zentral eine redundante Speicherung ermöglicht werden, während die vorhandenen Ressourcen bestmöglich ausgenutzt werden.