Vorausschau: Energie, Nachhaltigkeit & System Design

Kategorie: Q&A · Channel: #vorausschau

Motto: Atmen kommt zuerst


Die Grundfrage

Ein RZ das nicht atmet, stirbt.
Atmen bedeutet:
→ Energie die nicht verschwendet wird
→ Wissen das nicht verloren geht
→ Menschen die verstehen was sie betreiben
→ Systeme die lĂ€nger leben als ihre erste Saison

Nachhaltigkeit im RZ ist kein Umwelt-Marketing.
Es ist die Bedingung dafĂŒr dass alles andere funktioniert.


Teil 1: Energie – was verbraucht was

PUE – Power Usage Effectiveness

PUE = Gesamtenergie RZ / Energie fĂŒr IT-Hardware

PUE 1.0  = perfekt (100% fĂŒr IT, 0% Overhead)
PUE 1.2  = sehr gut (moderne, effiziente RZ)
PUE 1.5  = durchschnittlich
PUE 2.0  = schlecht (jedes Watt IT = 1 Watt Overhead)
PUE 3.0+ = alt, ungekĂŒhlt, ineffizient

Typische Overhead-Quellen:
→ KĂŒhlung:        40-60% des Overheads
→ USV / Strom:    10-20%
→ Beleuchtung:     2-5%
→ Sonstiges:       5-10%

Was ein einzelner Server verbraucht

Typische Werte (grob):

Alter Server (2010, 2U, Xeon):
→ Idle:    150-200W
→ Last:    300-400W
→ Jahr:    ~2.000 kWh bei 50% Last

Moderner Server (2024, 1U, aktueller Xeon):
→ Idle:     50-80W
→ Last:    200-300W
→ Jahr:    ~1.000 kWh bei 50% Last

ARM-Server (Ampere Altra, 2024):
→ Idle:     30-50W
→ Last:    100-150W
→ Jahr:    ~700 kWh bei 50% Last

Fazit:
Ein alter Server der "noch lÀuft" kostet
oft 2-3x mehr Strom als ein neuer –
und das jeden Tag, 24 Stunden.

Die Konsolidierungsrechnung

Szenario: 10 alte Server → 1 moderner Server + Proxmox

Vorher:
  10 × 200W (idle) = 2.000W
  10 × 2.000 kWh/Jahr = 20.000 kWh/Jahr
  Bei 0,30 €/kWh = 6.000 €/Jahr Strom

Nachher (1 moderner Server, 10 VMs):
  1 × 120W (idle, 10 VMs) = 120W
  ~1.050 kWh/Jahr
  Bei 0,30 €/kWh = 315 €/Jahr Strom

Ersparnis: ~5.700 €/Jahr
Amortisation neuer Server: < 1 Jahr

Plus:
→ Weniger Hardware = weniger AusfĂ€lle
→ Weniger KĂŒhlung nötig
→ Weniger Wartungsaufwand
→ Snapshots, Live-Migration, Backup einfacher

Teil 2: Hardware-Lebenszyklus

Wann lohnt sich neuer Hardware wirklich?

Faustregel:
→ Server Ă€lter als 7 Jahre:    Konsolidierung prĂŒfen
→ Server Ă€lter als 10 Jahre:   Konsolidierung dringend
→ EOL Software (PHP 7.2 etc.): Modernisierung erzwingen

Aber: nicht jeder alte Server muss weg.

Sinnvolle Weiterbetrieb-Szenarien:
→ Dediziertes Backup-System (lĂ€uft selten)
→ Air-gapped Systeme ohne Internetzugang
→ Spezial-Hardware ohne VM-Alternative
→ Test-/Lab-Umgebung mit geringer Laufzeit

Unsinniger Weiterbetrieb:
→ Produktiv-Server mit EOL-OS
→ Server der tĂ€glich lĂ€uft und 3x mehr verbraucht
→ Systeme die niemand mehr kennt oder dokumentiert hat

CPU Power States – das stille Sparpotenzial

# C-States: CPU-SchlafzustÀnde bei Idle
# Je höher der C-State, desto tiefer der Schlaf, desto weniger Verbrauch

# Aktuellen Zustand prĂŒfen:
cat /sys/devices/system/cpu/cpu0/cpuidle/state*/name
cat /sys/devices/system/cpu/cpu0/cpuidle/state*/usage

# P-States: CPU-Takt bei Last
# CPU drosselt automatisch wenn wenig Last

# Energiesparmodus prĂŒfen:
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
# powersave    → maximales Sparen (gut fĂŒr wenig genutzte Server)
# performance  → maximale Leistung (gut fĂŒr DB-Server)
# ondemand     → automatisch (Standard)

# Setzen:
echo powersave | tee /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor

Teil 3: Wissen als Ressource

Das unsichtbare Energieproblem

Was kostet es wenn ein Admin geht und sein Wissen mitnimmt?

Szenario: Senior-Admin nach 15 Jahren verlÀsst das Team
→ Neuer Admin braucht 6-12 Monate um das System zu verstehen
→ In dieser Zeit: mehr Fehler, lĂ€ngere Ausfallzeiten
→ Wert des verlorenen Wissens: schwer zu berechnen, aber real

Das ist keine Energie-Verschwendung im physischen Sinne –
aber es kostet Zeit, Geld und im RZ: VerfĂŒgbarkeit.

Dokumentation als Nachhaltigkeitsmaßnahme

ozmai ist kein Chat-Tool.
ozmai ist ein Wissens-Erhaltungs-System.

Jeder ingestierte Chunk:
→ rettet Wissen vor dem Vergessen
→ macht einen Admin unabhĂ€ngig von einem anderen
→ verlĂ€ngert die "Lebensdauer" von Infrastruktur-Wissen

"Der vergessliche Admin" ist kein Versagen –
er ist der Normalzustand bei komplexen Systemen.
Das Werkzeug kompensiert was das Gehirn nicht leisten kann.

Der Transfer-Gedanke

Wissen hat drei ZustÀnde:

1. Im Kopf     → flĂŒchtig, stirbt mit dem Admin
2. Im Wiki     → statisch, veraltet, wird nicht gefunden
3. Im Vektor   → lebendig, durchsuchbar, wĂ€chst mit der Erfahrung

Der Übergang von 1 → 3 ist keine Digitalisierung.
Es ist Konservierung von dem was Menschen gelernt haben –
damit andere nicht nochmal von vorne anfangen mĂŒssen.

Teil 4: System Design mit Weitblick

Die drei Fragen vor jedem neuen System

1. Wer betreibt das in 5 Jahren?
   → Dokumentation von Anfang an
   → kein "ich erklĂ€re das spĂ€ter"
   → ozmai als Pflicht, nicht als Option

2. Was verbraucht das in 5 Jahren?
   → Konsolidierungspotenzial einplanen
   → Virtualisierung wo möglich
   → ARM/effiziente Hardware evaluieren

3. Was passiert wenn es ausfÀllt?
   → RAID, Backup, Monitoring von Anfang an
   → nicht als NachrĂŒstung
   → "es lief bisher immer" ist kein Konzept

Proxmox als nachhaltiger Ansatz

Warum Proxmox + VMs nachhaltiger ist als bare-metal:

→ Konsolidierung:  viele Dienste, eine Hardware
→ Snapshots:       Fehler sind rĂŒckgĂ€ngig machbar
→ Live-Migration:  Hardware tauschen ohne Downtime
→ Backup:          einfacher als bare-metal
→ Ressourcen:      dynamisch zugeteilt, nicht verschwendet
→ Wissen:          eine Plattform fĂŒr alle VMs

OPNsense als erste VM auf Proxmox:
→ Firewall als Code (Backup/Restore der Config)
→ Updates ohne Produktionsausfall
→ Rollback wenn Update schiefgeht

Teil 5: Das Motto

"Atmen kommt zuerst –
 Energie, Verbrauch, Nachhaltigkeit
 sind kein Luxus sondern Fundament"

Was das bedeutet:

FĂŒr den Server:
→ Effizienz ist keine Option, sie ist das Fundament
→ Ein System das atmet, verbraucht was es braucht
→ Ein System das nicht atmet, vergeudet was es hat

FĂŒr das Wissen:
→ Dokumentation ist kein Overhead
→ sie ist die Luft die das System am Leben hĂ€lt
→ wenn das Wissen stirbt, stirbt das System mit

FĂŒr den Admin:
→ Nachhaltig arbeiten bedeutet:
   heute so bauen dass morgen jemand
   anderes es versteht, betreibt und verbessert
→ Das RZ ohne Menschen ist eine tote Maschine
→ Der Mensch im RZ ist der eigentliche Wert

WeiterfĂŒhrende Fragen fĂŒr #vorausschau

→ Wie plane ich eine Migration von bare-metal auf Proxmox?
→ Welche Metriken zeigen ob ein Server konsolidiert werden sollte?
→ Wie dokumentiere ich so dass ozmai optimal lernt?
→ Wann ist ARM-Hardware sinnvoll im RZ?
→ Wie berechne ich den ROI einer Konsolidierung?