Die Vorteile der Rechenzentrumsredundanz im digitalen Zeitalter

Wir sagen das „D“-Wort nicht gerne laut, aber Stromausfälle sind die Hauptursache für gefürchtete „Ausfallzeiten“ in Rechenzentren, die normalerweise durch Überhitzung oder Geräteausfall verursacht werden. 

Woher der Ausfall auch kommt, das Endergebnis ist immer dasselbe – Datenverlust, beschädigte Dateien und zerstörte Geräte, was erhebliche, manchmal katastrophale Geldverluste und Tausende von unzufriedenen Benutzern bedeutet.

Letzten Sommer sind Ihnen vielleicht Berichte über Rechenzentren aufgefallen, die während Hitzewellen Probleme hatten und unter schmerzlich störenden Ausfallzeiten litten. Das Uptime Institute stellte fest, dass Ausfallzeiten Rechenzentren regelmäßig über 1 Million £ kosten. (https://dcnnmagazine.com/data-centres/data-centre-outages-crestchic-loadbanks/)

Wie also können immer teurere und schädlichere Ausfallzeiten verhindert werden?

Rechenzentren bauen jetzt Redundanz in ihre Infrastruktur ein, sodass kritische Systeme im Falle eines Ausfalls weiterlaufen können.

Was ist Rechenzentrumsredundanz?

Kurz gesagt beinhaltet die Redundanz von Rechenzentren die Duplizierung kritischer Komponenten eines Systems, um die Zuverlässigkeit zu verbessern. Ein bisschen wie ein Backup. Die Redundanz von Rechenzentren konzentriert sich in der Regel darauf, wie viel Ersatzstrom während eines Stromausfalls als Backup verwendet werden kann.

Wie können Rechenzentren bei unvorhergesehenen Stromausfällen ausreichend Redundanz einplanen?

Große Unternehmen betreiben ihre Server in Tier-3- und Tier-4-Rechenzentren, die im Vergleich zu den Tiers 1 und 2 eine hohe Leistung und Verfügbarkeitsgarantien bieten. Jede Stufe bietet jedoch unterschiedliche Ebenen von Redundanzsystemen. Tier 3 bietet normalerweise N+1, während Tier 4 2N oder 2N+1 bietet.

Wie viele Ns benötigen Rechenzentren?

Einfach ausgedrückt ist N das Maß für die Menge an Redundanzausrüstung, die erforderlich ist, um ein Rechenzentrum am Laufen zu halten.

N+1 wird auch als Parallelredundanz bezeichnet und sorgt dafür, dass immer eine unterbrechungsfreie Stromversorgung (USV) zur Verfügung steht. Es ist so, als hätte man für jeweils zehn Server einen zusätzlichen Backup-Server, sodass im Falle, dass ein primäres Element ausfällt und zu Wartungszwecken entfernt werden muss, eine zusätzliche Komponente ausgeführt wird. N+1-Backup-Lösungen arbeiten bei lokalen oder regionalen Ausfällen mindestens 72 Stunden lang. Es ist jedoch nicht vollständig ausfallsicher, da es auf einem gemeinsamen Stromkreis und nicht auf einer eigenen separaten Einspeisung läuft.

Wie wäre es mit 2N? Auch als N+N bekannt, bietet dies ein vollständig redundantes, vollständig gespiegeltes System mit zwei unabhängigen Systemen, sodass beim Ausfall einer primären Komponente eine identische Standby-Replik für die Fortführung des Betriebs einspringen kann.

Und um wirklich alle Grundlagen abzudecken, bietet 2N+1 eine doppelte Abdeckung plus ein zusätzliches Gerät, sodass im Falle eines längeren Ausfalls eine zusätzliche Backup-Komponente vorhanden ist, um einen Ausfall abzudecken, während das Sekundärsystem läuft.

Ist Rechenzentrumsredundanz die einzige Lösung?

Ein Redundanzsystem ist für Rechenzentren von entscheidender Bedeutung, aber es gibt andere Möglichkeiten, Ausfälle zu verhindern.

Wie bereits erwähnt, können Ausfälle durch wärmeres Wetter ausgelöst werden. Viele Rechenzentren suchen nach alternativen Kühlmethoden, sei es Luftkühlung, Flüssigkeitskühlung oder sogar die Migration in kühlere Länder. 

Die Kühlung im Griff zu haben, kann nicht nur Ausfallzeiten verhindern, sondern angesichts der enormen Wärmemengen, die Rechenzentren produzieren, auch enorme Geldbeträge einsparen.

Unsachgemäßes Data Center Infrastructure Management (DCIM) und unzuverlässige Prozesse können zu Überhitzung führen, einer der Hauptursachen für Ausfälle, Energie- und Geldverschwendung. Wenn Rechenzentren keine genauen Daten über ihre Systeme haben und wo sich veraltete Geräte befinden, kann es sogar zu einer Unterkühlung kommen.

Stromabfälle oder Spannungsspitzen können zum Herunterfahren oder zur Beschädigung von Servern führen.

USV-Systeme (unterbrechungsfreie Stromversorgung) sollten vorhanden sein, aber es besteht immer noch die Möglichkeit einer Unterbrechung der Kühlsysteme, die zu einer Überhitzung führen könnte.

Stromverbrauchssensoren können den Stromverbrauch des Racks nachverfolgen, wodurch veraltete Server durch effizientere Geräte ersetzt werden können.

Ausfälle können auch durch menschliches Versagen und ungenaue Wartung und Verwaltung von Servern auftreten. Rechenzentren können solche Vorkommnisse mit DCIM leicht verhindern, das Prozesse rationalisiert und sogar bevorstehende Ausfälle vorhersagt, was schnellere Reaktionen und Vorbeugung ermöglicht.

Was kann DCIM noch tun, um Ausfallzeiten zu vermeiden? Und kann es neben Rechenzentrumsredundanz funktionieren?

Das ultimative Team – DCIM und Rechenzentrumsredundanz

Rechenzentrumsredundanz allein ist ein Rechenzentrumsretter. Ebenso bietet DCIM, isoliert verwendet, innovative Methoden zur Messung, Überwachung und Verwaltung von Rechenzentren, wodurch optimierte Umgebungen und eine längere Betriebszeit geschaffen werden.

Wenn Sie beides zusammennehmen, haben Sie die Vorteile eines Backups, das durch die Vorteile einer intelligenten Präventionssoftware verstärkt wird.

Wie trägt DCIM neben Kühlung, USV und optimierten Prozessen zur Gewährleistung der Betriebszeit bei? Es bietet eine vollständige Sichtbarkeit der Verbrauchsdaten, während Trendverlaufsdaten eine einfache Planung des zukünftigen Energieverbrauchs ermöglichen.

Es ist an der Zeit, mit einem voll effizienten und optimierten Rechenzentrum dem Risiko von Ausfallzeiten einen Schritt voraus zu sein. Implementieren Sie DCIM der nächsten Generation von Assetspire, um Ihre Assets zu überwachen und potenzielle Probleme zu erkennen, bevor sie zu großen Problemen werden, wodurch störende Ausfallzeiten und Datenverluste minimiert und Geld gespart werden.

Gewinnen Sie Echtzeit-Einblicke in Kapazität, aktuelle und vergangene Nutzung und Verwaltung von Energiequellen. Die intelligente Lösung von Assetspire für DCIM-Software bietet einen vollständigen und genauen Überblick über alle Assets, sodass Sie genau sehen können, wo sich die veralteten und veralteten Geräte befinden, die Energie verschwenden, und bietet den Einblick, um ältere Assets wiederzuverwenden oder zu ersetzen und Ausfallzeiten zu vermeiden.

(https://www.assetspire.co.uk/solutions/datacentre-infrastructure-management/)

Steve Beber

Nachdem er die letzten 15+ Jahre im Technologiebereich verbracht hat, hauptsächlich in Rechenzentren und kritischen Anlagen- und Maschinenräumen, identifizierte Steve eine Marktlücke, indem er Unternehmen schnell genaue Asset-Daten über die Assets, die sie besitzen, und den Lebenszyklus zur Verfügung stellte und Kapazität dieser Assets, die Compliance, Nutzung und Vorbereitung auf Wachstum sicherstellen.

Die Digital Transformation Expo findet am 2. und 3. Oktober in London statt. Jetzt registrieren!