Meine Erlebnisse mit den „Dynamic Cloud Servern“ von 1und1

Das hier ist eine Geschichte, geprägt von Freud und Leid. Weil ich sie hier aufschreibe, ist das Leid im Vordergrund. Primär schreibe ich sie zur Selbst-Therapie auf und dass ich mich in einigen Jahren noch auf was berufen kann, wenn mich meine Erinnerung bei der Provider-Wahl zu trügen versucht.

Wir haben zurzeit 3 Webserver, alle mit dem Betriebssystem Windows Server von Microsoft. Einen Server für Zeta Uploader (ein Tool um große Dateien online zu versenden), einen Server für verschiedene Kunden-Websites, und einen Server für die Produktwebsites zu Zeta Producer (ein Content-Management-System) und Zeta Test Management (ein Test-Management-System).

Bis vor 2 Wochen waren alle Server über Jahre hinweg bei 1und1 gehostet. Seit zwei Wochen sind nun 2 der drei Server bei Internet 24 gehostet.

Wir haben über ein Jahr lang gelitten, geschwitzt, geflucht, gebettelt, gehofft und immer wieder Kunden über Downtimes hinweg versucht zu tröste (ich glaube wir waren der beste Nutzer von Uptime Robot). Am Ende hat alles nichts genutzt und wir mussten umziehen.

Was lief alles schief

Die Idee der „Dynamic Cloud Server“ klingt verlockend: Virtualisierte Server (mit Xen) mit schöner Admin-Web-GUI bei der ich via Schieberegler diverse Einstellungen wie RAM, CPU und Festplatte so konfigurieren kann, dass ich sie an unsere Bedürfnisse anpassen kann.

In der Praxis war genau das Gegenteil der Fall: Die Server reagierten träge, langsam und mit häufigen Ausfällen. Meine starke Vermutung ist, dass die Host-Rechner (also die physikalischen Computer, auf denen die virtuellen Computer laufen) so maximal ausgelastet sind, dass ich mit den Schiebereglern zwar meine Wünsche angeben kann, jedoch diese nichts mit der tatsächlichen Ressourcen-Zuteilung in der Praxis zu tun haben. Doch selbst eine schlechte Performance hätte ich verkraftet, wären da nicht die ständigen/häufigen Ausfälle gewesen.

Unser Zeta-Uploader-Server ist die rühmliche Ausnahme: Der läuft weiterhin bei 1und1, und zwar wie die sprichwörtliche 1: Er ist nicht der schnellste, dafür ist er quasi immer erreichbar und quasi nie down. Dieser Server läuft, so wie ich es wohl verstanden habe, auf einer Xen-5.5-Umgebung. Keine Treiber-Issues, nix.

Unsere beiden anderen Server liefen auf einer Xen-6.x-Umgebung.

Und genau diese beiden Server liefen wie Dreck. Nämlich nach Lust und Laune des Hosters. Meistens am Wochenende waren sie nicht erreichbar, erst am Montag, nachdem wohl ein Techniker die Hosts neu gebootet/whatever damit gemacht hat. Das ganze lief regelmäßig, pünktlich zum Wochenende so ab:

Server antwortet nicht mehr.
Control-Center (Web-Oberfläche) erlaubt es nicht den Server aus- und wieder einzuschalten.
Hotline schafft es nicht, Server aus- und wieder einzuschalten.
2nd-Level-Kollegen von Hotline schaffen es nicht, Server aus- und wieder einzuschalten.
Administratoren schaffen es dann (nur Werktags!) wohl irgendwie, den Server auszuschalten.
Ich entdecke zufällig, dass ich Server jetzt wieder hochfahren kann.
Ich fahre Server via Control-Center hoch.
Server startet natürlich nicht normal, sondern im Rescue-Modus.
Ich boote neu im normalen Modus.
Server booten in Zeitlupe.
Nach 40 Minuten(!) warten ist Server dann gebootet.
Server läuft immer noch in Zeitlupe.

Die ersten zig Male habe ich immer versucht, Fehler bei mir selbst zu finden und alles mögliche probiert, leider erfolglos. Irgendwann haben wir dann einen „Platin-Support“ für etwa 10 Euro pro Monat mit dazu gebucht. Effekt war, dass die Warteschleife umgangen wurden, die Supporter dahinter waren genau so höflich und kompetent wie beim Nicht-Platin-Support. Also höflich und hilfsbereit waren sie wirklich, kompetent im Sinne von, dass sie etwas bewirken konnten, waren sie leider nicht. Es hieß am Wochenende dann oft „das müssen wir an den 2nd-Level-Support eskalieren lassen“ (oder so ähnlich), mit dem Zusatz „das kann schon Montag werden, bis es wieder läuft“. Arrgh. Da saß ich immer wie auf Kohlen.

Schön (im sarkastischen Sinne) waren anschließend auch immer die belanglosen, wohl von Robotern erstellten E-Mail-Nachrichten:

Ihr Dynamic Cloud Server ist wieder wie gewohnt erreichbar.
Bitte entschuldigen Sie die entstandenen Unannehmlichkeiten.
Wir wünschen Ihnen weiterhin viel Spaß mit unseren Produkten.

Es hat viele Versuche gedauert, bis 1und1 überhaupt zugegeben hat, dass der Fehler bei ihnen liegt. Es hieß dann lapidar „Es lag eine Störung im Hostsystem vor“. (Ob so was hier [als Bild] wohl repräsentativ ist?)

Lösungsansätze

Irgendwann habe ich dann angefangen, mich weiter zu erkundigen und bin auf die Möglichkeit gestoßen, die Xen-Netzwerk-Treiber in meinem Gast-Windows zu aktualisieren. Da habe ich wirklich viel Zeit investiert und nach viel nachbohren dem 1und1-Support wenigstens die Xen-Versionsnummer entlocken können. Sogar einen Bekannten („Facebook-Freund“), der bei Citrix arbeitet (die Firma hinter Xen) habe ich mit den Fehlern und der Thematik konfrontiert und er hat mir einige Tipps geben können, die gefühlt geholfen haben. Objektiv waren jedoch immer wieder die Aussetzer der Server.

Ich habe meinen Bekannten auch gefragt, ob man mit Xen 6 überhaupt ein stabiles System hinbekommen kann, worauf er mir mit Screenshots von Uptime-Charts von 190+ Tagen geantwortet hat. Es geht also. Xen kann das, die Admins scheinen es hier wohl nicht hin zu bekommen. Warum auch immer, ich vermute einfach Kostendruck.

Eines Tages habe ich dann einen ehrlichen Supporter am Telefon gehabt, der mir am Ende sagte „Ach, wissen Sie, Xen und Windows, das ist auf Dauer einfach nicht stabil hin zubekommen“. Der Tenor war für mich „Damit müssen Sie leben, seien Sie froh, dass es überhaupt läuft“. WTF? Dass unser Xen-5.5-Server stabil läuft ist für mich ein Beweis, dass es durchaus funktionieren kann, ebenso wie die Aussagen meines Bekannten.

Lösung

Es musste also eine Lösung her, und die war eindeutig außerhalb von 1und1 zu sehen. Doch wie vorgehen, um nicht vom Regen in die Traufe zu kommen?

Jeder Hoster, den ich mir so angeschaut habe hatte Vor- und Nachteile. Mal zu groß, mal zu klein, mal keine Windows-Server und mal irgend was anderes seltsames. Mein geschätzter Kollege M. hat dann nach viel Recherche und einigen Telefonaten den Hoster „Internet 24“ in Dresden ausfindig gemacht. Der ist groß genug um saubere Technik und Kompetenz zu liefern und gleichzeitig persönlich genug um immer direkt einen kompetenten Techniker am Draht zu haben.

Seit ca. 2 Wochen laufen jetzt also unsere Server bei Internet 24. Noch zu kurz um eine aussagekräftige Bewertung abzugeben, doch bereits der Anfang war geprägt von lauter positiven Eindrücken, die auch nach dem Kauf weiter anhielten, bis heute.

Epilog

Web-Hosting ist halt wohl ein genau so kaputter Markt wie alle anderen von BWL-ern „optimierten“ Branchen auch. Damit muss ich halt wohl leben und immer wieder mal zum „Server-Nomaden“ werden, wenn ein Hoster zu groß wird und die Qualität nachlässt.

Wenn 1und1 unsern auf Xen 5.5 laufenden Server nach Xen 6.x upgradet gehe ich davon aus, dass ich den auch umziehen muss, weg von 1und1.

Die Server bei Internet 24 sind schöne Intel-Xeon-Rechner mit viel RAM und Hewlett-Packard-RAID; der Support von Internet 24 ist erstklassig und tatsächlich per E-Mail Tag und Nacht sehr schnell und (fast immer) sehr kompetent zu erreichen.

Ich bin richtig glücklich mit Internet 24 und hoffe, das bleibt auch so.

Update 2013-11-03

Ich habe mir mal die Pingdom-Alerts angeschaut und ausgewertet:

(Hier als XLSX-Datei)

Es waren im Schnitt 10 Downtimes pro Monat. Pro Monat! Und das waren nur die, die Pingdom auch gemessen hat. Alles unter 5 Minuten ist da noch gar nicht dabei.

Update Mai 2018

Wir sind jetzt inzwischen fünf Jahre bei „Internet 24“. Das lief dort alles wesentlich stabiler als beim vorherigen Provider.

Unsere Hardware-Server sind inzwischen in die Jahre gekommen, und müssen irgendwann ausgetauscht werden.

Da „Internet 24“ inzwischen (mehrfach?) verkauft wurde, unsere Server inzwischen (mehrfach?) physikalisch in andere Rechenzentren umgezogen wurden, es ein paar wenige technische Peinlichkeiten gegeben hat (z. B. eine Firewall, die auf einmal wieder geschlossene Ports geöffnet hatte), und der Support sich in letzter Zeit auch von persönlichen Ansprechpartnern, hin zu unpersönlichen Web-Ticket-Masken hin geändert hat, haben wir uns entschieden, nochmals umzuziehen.

Die Wahl fiel dabei nach viel Nachdenken, Recherchieren, Ausprobieren und Testen auf Amazon Web Services, AWS.

Wir haben einen Kunden/Partner, der seit über 10 Jahren mit AWS sehr zufrieden ist, und uns die Thematik ausführlicher dargelegt hat. Inzwischen haben wir schon ein paar Linux- und Windows-Server bei AWS, und die Stabilität, Geschwindigkeit und Zuverlässigkeit sind atemberaubend.

Wenn man genau weiß, was man sich zusammen konfiguriert, sind nach unserer Erfahrung auch die Kosten sehr wettbewerbsfähig.

Gegen Mitte/Ende 2018 wollen wir alle Server zu AWS umgezogen haben.

11 Gedanken zu „Meine Erlebnisse mit den „Dynamic Cloud Servern“ von 1und1“

Robert sagt:

Azure? Amazon?

Antworten
29. Oktober 2013 um 23:03
CMS sagt:

Hatten wir uns auch überlegt und uns dagegen entschieden.

Grund war primär, dass das ja nochmals um viele Ebenen anonymer gewesen wäre als bei 1und1. Wenn dort dann mal was geklemmt hätte, hätten wir noch viel doofer aus der Wäsche geschaut, wenn wir schnell Hilfe benötigt hätten.

So zumindest unsere Überlegungen.

Antworten
30. Oktober 2013 um 01:02
Frank sagt:

auf der Suche nach dem Fehler – kommt mir irgendwie bekannt vor – habt ihr euch die auch angesehen:
http://www.hetzner.de/hosting/produkte_rootserver/ex10

Antworten
31. Oktober 2013 um 20:09
CMS sagt:

Heilige Scheiße! Ich dachte das ist nur bei 1und1 so. Also ein generelles Issue. Schade 🙁

Antworten
31. Oktober 2013 um 20:58
Falk sagt:

Moin,
sind die Erfahrungen immer noch so positiv?
Nach dem Zusammenschluss mit Loomes bzw. der Übernahme durch Host Europe hat sich die Erreichbarkeit der Technik drastisch verschlechtert. Vorbei die Zeiten, als Du auch noch mal am Freitag Abend direkt jemanden in der Technik anrufen konntest.
Aktuell warte ich bei Mailanfragen 1-4 Tage auf Antwort.

Antworten
20. September 2016 um 09:35
- CMS sagt:
  
  Erst heute waren unsere Server 5 Stunden offline, wohl weil sie ein Firewall-Update verkackt haben.
  
  Der Trend, alles weiter aufzukaufen, zu zentralisieren, zu vergrößern, ist sicher ein schlechter Trend für uns als Kunden.
  
  Antworten
  20. September 2016 um 09:38
Manfred Makosch sagt:

Ich kann diese Erfahrungen absolut nicht bestätigen.

Ich hatte vorher einen 1&1 Root Server Windows, bei dem es einen bösen Hardwarecrash gab. Ich bekam dann einen frisch aufgesetzten Rootserver. Meiner Bitte, die noch intakte Windows Sicherung darauf zu spielen, hat 1&1 nicht erfüllt – auf Betriebssystemebene greifen sie niemals ein – vermutlich um event. Schuldzuweisungen vorzubeugen.

Ich litt jedenfalls eine Woche wie ein Hund, bis alles wieder lief. Als gebranntes Kind switchte ich anschließend auf den Dynamic Cloudserver um, auch weil hier ein eigenes Backend besteht, in dem man komplette Systembackups herstellen kann – außerhalb Windows.
Laut 1&1 wird das System ständig gewartet und fehlerhafte Komponenten werden im laufenden Betrieb gewechselt.

Das Ganze ist jetzt 1 1/2 Jahre her und ich muss sagen, dass ich hochzufrieden bin. Es gab keinen einzigen Zwischenfall oder Ausfall. Die Leistung ist hervorragend (habe ca. 20 CMS gehostet). Einziger Wermutstropfen sind die Backup-Kosten. Hier langt 1&1 pro Image/Monat mit 14,40 + MwSt. unverhältnismäßig hin. Aber nach meinem Vorfall werden solche Summen dann zweitrangig.

Antworten
3. Februar 2017 um 12:23
- CMS sagt:
  
  Danke für Dein Feedback, Manfred.
  
  Echt schön zu hören, dass es gut bei Dir läuft!
  
  Antworten
  3. Februar 2017 um 12:32
Web App sagt:

Cloud-Server in der Nacht von Freitag auf Samstag „Beendet“ und nicht mehr startbar. Technischer (!) 1&1-Support ist am Wochenende inexistent, d.h. bis frühestens Montag warten, kein Kunde kann am Wochenende arbeiten. Ein völliges Unding, 1&1 ist komplett unbrauchbar als Hosting-Anbieter für Web-Anwendungen, wenn Sie im Notfall über 48 Stunden nichts, absolut gar nichts, tun und auch keinen optionalen 24/24 Service anbieten.

„Web-Hosting ist halt wohl ein genau so kaputter Markt wie alle anderen von BWL-ern “optimierten” Branchen auch.“

Das trifft es wohl. Bunte Bildchen, flashy Marketing, „activity“ anstatt „achievement“.

Glücklicherweise haben wir für Notfälle einen Spiegel-Server.

Antworten
14. Mai 2018 um 06:28
- CMS sagt:
  
  Danke für Dein Feedback.
  
  Das mit dem Wochenende hat mir seinerzeit auch immer den Schweiß auf die Stirn getrieben.
  
  Antworten
  14. Mai 2018 um 06:37
Madlener sagt:

Ich muss hier leider los werden, dass die 1und1 Cloudserver Probleme wie oben geschildert auch im Juli 2018 anhalten. Wir erleiden seit Monaten ein auf und ab. Unsere Webseite war von Samstag den14.07.18 bis Montag Vormittag 16.07.18 nicht brauchbar, insbesondere der Aufruf des Webshop führte stets zum Fehler 504 Gateway Time-out. Der Hotline Mitarbeiter war zwar freundlich, musste aber auf das Server Team verweisen, welches erst ab Montag wieder die Arbeit aufnehmen würde…

Antworten
16. Juli 2018 um 17:01

Schreibe einen Kommentar Antwort abbrechen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.