Wie schon im Titel ersichtlich – seit März tut sich einiges.

Gestern Morgen habe ich Wartungsarbeiten an unserem Webhosting-System “mars” abgeschlossen.

Der Server wurde im Januar 2010 in Betrieb genommen und mit 4 SATA-Festplatten ausgestattet.

Aus diversen, jetzt nicht mehr ganz so nachvollziehbaren Gründen, wurden diese damals als RAID5 konfiguriert. Dieses RAID5 war jedoch für einige Probleme verantwortlich, da sich der Server immer wieder selbst abgeschossen hat.

Durch die sehr große Anzahl an zufälligen Zugriffen (im Shared Webhosting kommt es eher selten zu sequentiellen Lese/Schreib-Vorgängen) wurde das RAID5 übermäßig beansprucht und somit musste das System auf die Festplatten warten. Nachdem aber weiterhin Anfragen am Webserver eintrafen, stauten sich alle Anfragen an und trieben den Load noch weiter in die Höhe.

Bei einem RAID10 werden zwei Festplatten gespiegelt (RAID1) und die beiden RAID1-Verbunde zu einem RAID0 zusammengefasst. Schreib-/Lese-zugriffe können somit auf die beiden RAID1-Verbunde verteilt werden, die Datenrate steigt. Die Neuberechnung von Parity-Bits, wie bei einem RAID5 notwendig, entfällt auch.

Ein Wechsel des darunterliegenden RAID-Systems ist im laufenden Betrieb nicht möglich, weshalb die Umstellung leider zu lange hinausgezögert wurde.

Die Wartungsarbeiten wurden dann aber doch kurzfristig durchgeführt:

  • Umzug aller Daten auf eine virtuelle Maschine auf einem anderen Server
  • Neukonfiguration der ursprünglichen Hardware als RAID10
  • Migration zurück aus der VM auf das Live-System

Die Arbeiten wurden gestern morgen abgeschlossen und waren äußerst erfolgreich – der Aufwand hat sich gelohnt, wie auch am Last-Graphen ersichtlich:

Serverlast in den letzten 7 Tagen, vor und nach dem RAID-Umbau

Was habe ich gelernt?

  • RAID5 ist in Produktivsystemen mit vielen Zugriffen nicht zu gebrauchen
  • mit RAID10 gehen zwar 50% der Festplattenkapazität “verloren”, der Geschwindigkeitsvorteil lohnt sich aber
  • die Migration eines physikalischen Servers in eine mit XEN virtualisierte Maschine geht vollkommen problemlos.

Next Post Previous Post