Der Betrieb von Rechenzentren steht vor dem Eintritt in eine Ära vernetzter Intelligenz auf allen Infrastrukturebenen. Die Rack-Dichte übersteigt 140 Kilowatt (kW), und die Workloads stoßen an die Grenzen der thermischen und Leistungsaufnahme herkömmlicher Systeme. Mit zunehmender Komplexität und Vernetzung der Infrastrukturen steigen die Folgen von Betriebsausfällen.
Laut der globalen Rechenzentrumsumfrage 2025 des Uptime Institute kostet jeder fünfte schwerwiegende Ausfall die Betreiber mittlerweile mehr als eine Million US-Dollar, wobei selbst kleinere Störungen immer kostspieliger werden (siehe Abbildung 1). Der anhaltende Fachkräftemangel erhöht den Druck auf die Verwaltung fortschrittlicher Kühlsysteme, hochdichter Racks und komplexer Stromversorgungssysteme.



Abbildung 1. Eine Grafik veranschaulicht die geschätzten Gesamtkosten von Ausfallzeiten, von der Unterbrechung bis zur vollständigen Wiederherstellung, einschließlich direkter Kosten, Opportunitätskosten und Reputationsschäden, basierend auf einer Umfrage des Uptime Institute. Quelle: Uptime Institute

Um mit den steigenden Anforderungen Schritt zu halten, integrieren Betreiber verstärkt intelligente und koordinierte Lösungen in das Management ihrer Rechenzentrumsinfrastruktur. Sie verknüpfen Stromversorgung, Kühlung und Rechenleistung über integrierte Systeme, die sich in Echtzeit anpassen. Der Übergang von isolierter Überwachung und Steuerung hin zur IT/OT-Konvergenz erfolgt, um den Bedarf zu decken und gleichzeitig die Energieeffizienz von Rechenzentren zu steigern.

Vergleich von IT und OT
: Informationstechnologie (IT): Systeme zur Verarbeitung, Speicherung und Übertragung digitaler Daten, wie Server, Netzwerke und Unternehmenssoftware.
Betriebstechnologie (OT): Systeme zur Überwachung und Steuerung physischer Infrastruktur, wie z. B. Stromverteilungsanlagen, Kälteanlagen und Gebäudeautomationssysteme.
Was ist IT/OT-Konvergenz?
IT/OT-Konvergenz bezeichnet die Integration digitaler und physischer Systeme in ein einheitliches Betriebsmodell (siehe Abbildung 2). Laut der International Society of Automation (ISA) ermöglicht diese Technologie Unternehmen die Vereinheitlichung von Datenmodellen und Steuerungssystemen über alle Umgebungen hinweg. Ziel der IT/OT-Konvergenz ist die Verbesserung von Transparenz, Automatisierung und Entscheidungsfindung durch die Förderung der Zusammenarbeit zwischen zuvor isolierten Funktionen.

Vertiv Next Unify DCD AD Diagramme 1 1000x1000
Abbildung 2. Ein Beispiel für die IT/OT-Konvergenz im Rechenzentrumsbetrieb, das die Verbindung zwischen einem Rechenzentrumsleitstand und einer fortschrittlichen IT-Infrastruktur verdeutlicht. Quelle: Vertiv

Anwendungsfälle der IT/OT-Konvergenz:
Integrierte Betriebsabläufe verändern bereits die reale Rechenzentrumspraxis. Betreiber gewinnen durch die Vernetzung von Kühlung, Stromversorgung und IT-Systemen über einheitliche Plattformen mehr als nur Transparenz. Dies ermöglicht Echtzeit-Reaktionsfähigkeit und ein energieeffizienteres Infrastrukturmanagement. 1. KI-gesteuerte Rechenzentrumskühlung:
Google hat ein KI-gestütztes Steuerungssystem entwickelt, das IT-Workload-Daten mit der betrieblichen Kühlinfrastruktur verknüpft. Daten von Tausenden von Sensoren werden alle fünf Minuten an eine Cloud-basierte KI gesendet, die optimale Kühleinstellungen berechnet.
Diese Einstellungen werden anhand von Sicherheitsgrenzwerten wie Temperaturschwellen, Feuchtigkeitsgrenzen und Betriebsbereichen der Geräte geprüft, bevor sie von den lokalen Steuerungssystemen umgesetzt werden. Verstößt eine KI-generierte Aktion gegen diese Sicherheitsprotokolle, lehnt das Steuerungssystem sie ab, wendet konservative Kühlrichtwerte an und benachrichtigt die Betreiber. Diese geschlossene Regelkreiskonfiguration mit integrierter Redundanz ermöglicht Echtzeit-Kühlungsanpassungen basierend auf der aktiven IT-Last und reduziert den Kühlenergieverbrauch standortübergreifend um durchschnittlich 30 %. Da die Kühlung typischerweise 30–40 % des gesamten Energieverbrauchs von Rechenzentren ausmacht, ergeben sich dadurch erhebliche Betriebskosteneinsparungen. 2. Integriertes Management für Strom- und Wärmesysteme:
Telemetriedaten von unterbrechungsfreien Stromversorgungen (USV), Stromverteilungseinheiten (PDU) und Kühlsystemen werden mithilfe offener Kommunikationsprotokolle wie Modbus und Simple Network Management Protocol (SNMP) aggregiert und standardisiert. Bediener können diese Systeme über eine einzige Schnittstelle überwachen und steuern und erhalten so Echtzeit-Einblicke in Energieverbrauch, Gerätestatus und Umgebungsbedingungen (siehe Video 1).

Video 1. Vertiv™ Unify, eine dezentrale Automatisierungsplattform, standardisiert beispielsweise Prozesse an allen Standorten und unterstützt Rechenzentrumsbetreiber bei der Skalierung ihrer Abläufe bei gleichzeitig gleichbleibender Leistung und Zuverlässigkeit.
3. Einheitliche Überwachung von IT- und Gebäudesystemen:
Equinix kombiniert Netzwerk-, Anwendungs-, Energie- und Umgebungsdaten in einer einheitlichen Überwachungsschicht. APIs und Integrationen mit Asset-Management- und DCIM-Plattformen konsolidieren Telemetriedaten von digitalen und physischen Systemen.
Betreiber können diese Daten über zentrale Dashboards oder Drittanbieter-Tools einsehen und so domänenübergreifende Probleme, wie beispielsweise einen Kühlungsausfall mit Auswirkungen auf die Netzwerkleistung, schneller erkennen.
4. Zustandsorientierte Wartung kritischer Infrastrukturen:
Vertiv nutzt die IT/OT-Konvergenz, um zustandsorientierte Wartung und fortschrittliches Monitoring zu unterstützen. Cloudbasierte Plattformen analysieren kontinuierliche Telemetriedaten von Gebäudesystemen und IT-Workloads, um Zustandsbewertungen zu generieren und Leistungsabweichungen zu identifizieren.
Die Mitarbeiter des Rechenzentrums nutzen diese Zustandsdaten, um den Anlagenzustand zu beurteilen und die planmäßige Wartung auf Komponenten mit erkannten Anomalien zu konzentrieren. So wird der Nutzen jedes Servicebesuchs maximiert (siehe Abbildung 3). Betreiber nutzen zudem historische Leistungsbenchmarks, um Lebenszyklustrends zu bewerten und die zukünftige Kapazitätsplanung zu optimieren.
Grafik zu zustandsorientierten Wartungsdienstleistungen von Vertiv, Abbildung 1
Abbildung 3 zeigt die Entwicklung der Instandhaltung. Durch Veränderungen und die anschließende Kombination von veralteten und fortschrittlichen traditionellen Verfahren können Unternehmen ein Instandhaltungsmodell entwickeln, das die Verfügbarkeit, Effizienz und die kontinuierliche Lebensdauer ihrer Anlagen optimiert.

Warum die IT/OT-Konvergenz heute eine Kerninfrastruktur ist:
Mit zunehmender Skalierung der Infrastruktur und steigendem Betriebsdruck führt die Trennung von IT- und Betriebstechnologie-Silos zu blinden Flecken und Ineffizienzen, die den heutigen Anforderungen an Geschwindigkeit und Genauigkeit nicht mehr gerecht werden. Die Zusammenführung ermöglicht:
• Einheitliche Transparenz: Durch die gemeinsame Betrachtung von Strom-, Kühlungs- und IT-Daten werden Probleme schneller erkannt und ihre Ursachen geklärt.
• Schnellere Entscheidungen: Echtzeit-Einblicke aus der physischen und digitalen Ebene beschleunigen die Fehlersuche und Planung.
• Vorausschauende Zuverlässigkeit: Die frühzeitige Erkennung von Unregelmäßigkeiten reduziert Ausfallzeiten und verlängert die Lebensdauer der Geräte.
• Skalierbarer Betrieb: Standardisierte Prozesse erhöhen die Wahrscheinlichkeit konsistenter Ergebnisse an mehreren Standorten.
• Energieeffizienz: Koordiniertes Last- und Kühlungsmanagement reduziert den Energieverbrauch bei gleichzeitiger Einhaltung der Betriebsgrenzen.

 

Artikel bereitgestellt von Vertiv – http://www.vertiv.com