Vorausschau: Energie, Nachhaltigkeit & System Design
Kategorie: Q&A · Channel: #vorausschau
Motto: Atmen kommt zuerst
Die Grundfrage
Ein RZ das nicht atmet, stirbt.
Atmen bedeutet:
â Energie die nicht verschwendet wird
â Wissen das nicht verloren geht
â Menschen die verstehen was sie betreiben
â Systeme die lĂ€nger leben als ihre erste Saison
Nachhaltigkeit im RZ ist kein Umwelt-Marketing.
Es ist die Bedingung dafĂŒr dass alles andere funktioniert.
Teil 1: Energie â was verbraucht was
PUE â Power Usage Effectiveness
PUE = Gesamtenergie RZ / Energie fĂŒr IT-Hardware
PUE 1.0 = perfekt (100% fĂŒr IT, 0% Overhead)
PUE 1.2 = sehr gut (moderne, effiziente RZ)
PUE 1.5 = durchschnittlich
PUE 2.0 = schlecht (jedes Watt IT = 1 Watt Overhead)
PUE 3.0+ = alt, ungekĂŒhlt, ineffizient
Typische Overhead-Quellen:
â KĂŒhlung: 40-60% des Overheads
â USV / Strom: 10-20%
â Beleuchtung: 2-5%
â Sonstiges: 5-10%
Was ein einzelner Server verbraucht
Typische Werte (grob):
Alter Server (2010, 2U, Xeon):
â Idle: 150-200W
â Last: 300-400W
â Jahr: ~2.000 kWh bei 50% Last
Moderner Server (2024, 1U, aktueller Xeon):
â Idle: 50-80W
â Last: 200-300W
â Jahr: ~1.000 kWh bei 50% Last
ARM-Server (Ampere Altra, 2024):
â Idle: 30-50W
â Last: 100-150W
â Jahr: ~700 kWh bei 50% Last
Fazit:
Ein alter Server der "noch lÀuft" kostet
oft 2-3x mehr Strom als ein neuer â
und das jeden Tag, 24 Stunden.
Die Konsolidierungsrechnung
Szenario: 10 alte Server â 1 moderner Server + Proxmox
Vorher:
10 Ă 200W (idle) = 2.000W
10 Ă 2.000 kWh/Jahr = 20.000 kWh/Jahr
Bei 0,30 âŹ/kWh = 6.000 âŹ/Jahr Strom
Nachher (1 moderner Server, 10 VMs):
1 Ă 120W (idle, 10 VMs) = 120W
~1.050 kWh/Jahr
Bei 0,30 âŹ/kWh = 315 âŹ/Jahr Strom
Ersparnis: ~5.700 âŹ/Jahr
Amortisation neuer Server: < 1 Jahr
Plus:
â Weniger Hardware = weniger AusfĂ€lle
â Weniger KĂŒhlung nötig
â Weniger Wartungsaufwand
â Snapshots, Live-Migration, Backup einfacher
Teil 2: Hardware-Lebenszyklus
Wann lohnt sich neuer Hardware wirklich?
Faustregel:
â Server Ă€lter als 7 Jahre: Konsolidierung prĂŒfen
â Server Ă€lter als 10 Jahre: Konsolidierung dringend
â EOL Software (PHP 7.2 etc.): Modernisierung erzwingen
Aber: nicht jeder alte Server muss weg.
Sinnvolle Weiterbetrieb-Szenarien:
â Dediziertes Backup-System (lĂ€uft selten)
â Air-gapped Systeme ohne Internetzugang
â Spezial-Hardware ohne VM-Alternative
â Test-/Lab-Umgebung mit geringer Laufzeit
Unsinniger Weiterbetrieb:
â Produktiv-Server mit EOL-OS
â Server der tĂ€glich lĂ€uft und 3x mehr verbraucht
â Systeme die niemand mehr kennt oder dokumentiert hat
CPU Power States â das stille Sparpotenzial
# C-States: CPU-SchlafzustÀnde bei Idle
# Je höher der C-State, desto tiefer der Schlaf, desto weniger Verbrauch
# Aktuellen Zustand prĂŒfen:
cat /sys/devices/system/cpu/cpu0/cpuidle/state*/name
cat /sys/devices/system/cpu/cpu0/cpuidle/state*/usage
# P-States: CPU-Takt bei Last
# CPU drosselt automatisch wenn wenig Last
# Energiesparmodus prĂŒfen:
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
# powersave â maximales Sparen (gut fĂŒr wenig genutzte Server)
# performance â maximale Leistung (gut fĂŒr DB-Server)
# ondemand â automatisch (Standard)
# Setzen:
echo powersave | tee /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
Teil 3: Wissen als Ressource
Das unsichtbare Energieproblem
Was kostet es wenn ein Admin geht und sein Wissen mitnimmt?
Szenario: Senior-Admin nach 15 Jahren verlÀsst das Team
â Neuer Admin braucht 6-12 Monate um das System zu verstehen
â In dieser Zeit: mehr Fehler, lĂ€ngere Ausfallzeiten
â Wert des verlorenen Wissens: schwer zu berechnen, aber real
Das ist keine Energie-Verschwendung im physischen Sinne â
aber es kostet Zeit, Geld und im RZ: VerfĂŒgbarkeit.
Dokumentation als NachhaltigkeitsmaĂnahme
ozmai ist kein Chat-Tool.
ozmai ist ein Wissens-Erhaltungs-System.
Jeder ingestierte Chunk:
â rettet Wissen vor dem Vergessen
â macht einen Admin unabhĂ€ngig von einem anderen
â verlĂ€ngert die "Lebensdauer" von Infrastruktur-Wissen
"Der vergessliche Admin" ist kein Versagen â
er ist der Normalzustand bei komplexen Systemen.
Das Werkzeug kompensiert was das Gehirn nicht leisten kann.
Der Transfer-Gedanke
Wissen hat drei ZustÀnde:
1. Im Kopf â flĂŒchtig, stirbt mit dem Admin
2. Im Wiki â statisch, veraltet, wird nicht gefunden
3. Im Vektor â lebendig, durchsuchbar, wĂ€chst mit der Erfahrung
Der Ăbergang von 1 â 3 ist keine Digitalisierung.
Es ist Konservierung von dem was Menschen gelernt haben â
damit andere nicht nochmal von vorne anfangen mĂŒssen.
Teil 4: System Design mit Weitblick
Die drei Fragen vor jedem neuen System
1. Wer betreibt das in 5 Jahren?
â Dokumentation von Anfang an
â kein "ich erklĂ€re das spĂ€ter"
â ozmai als Pflicht, nicht als Option
2. Was verbraucht das in 5 Jahren?
â Konsolidierungspotenzial einplanen
â Virtualisierung wo möglich
â ARM/effiziente Hardware evaluieren
3. Was passiert wenn es ausfÀllt?
â RAID, Backup, Monitoring von Anfang an
â nicht als NachrĂŒstung
â "es lief bisher immer" ist kein Konzept
Proxmox als nachhaltiger Ansatz
Warum Proxmox + VMs nachhaltiger ist als bare-metal:
â Konsolidierung: viele Dienste, eine Hardware
â Snapshots: Fehler sind rĂŒckgĂ€ngig machbar
â Live-Migration: Hardware tauschen ohne Downtime
â Backup: einfacher als bare-metal
â Ressourcen: dynamisch zugeteilt, nicht verschwendet
â Wissen: eine Plattform fĂŒr alle VMs
OPNsense als erste VM auf Proxmox:
â Firewall als Code (Backup/Restore der Config)
â Updates ohne Produktionsausfall
â Rollback wenn Update schiefgeht
Teil 5: Das Motto
"Atmen kommt zuerst â
Energie, Verbrauch, Nachhaltigkeit
sind kein Luxus sondern Fundament"
Was das bedeutet:
FĂŒr den Server:
â Effizienz ist keine Option, sie ist das Fundament
â Ein System das atmet, verbraucht was es braucht
â Ein System das nicht atmet, vergeudet was es hat
FĂŒr das Wissen:
â Dokumentation ist kein Overhead
â sie ist die Luft die das System am Leben hĂ€lt
â wenn das Wissen stirbt, stirbt das System mit
FĂŒr den Admin:
â Nachhaltig arbeiten bedeutet:
heute so bauen dass morgen jemand
anderes es versteht, betreibt und verbessert
â Das RZ ohne Menschen ist eine tote Maschine
â Der Mensch im RZ ist der eigentliche Wert
WeiterfĂŒhrende Fragen fĂŒr #vorausschau
â Wie plane ich eine Migration von bare-metal auf Proxmox?
â Welche Metriken zeigen ob ein Server konsolidiert werden sollte?
â Wie dokumentiere ich so dass ozmai optimal lernt?
â Wann ist ARM-Hardware sinnvoll im RZ?
â Wie berechne ich den ROI einer Konsolidierung?