22. February 2008, 12:12, by Steven Varco

New DB Servers

Our Dell PowerEdge 2950 Servers for the new DB Cluster has just arrived and I’m very excited, unpacking them. ;-)

Boxed Servers

(more…)

Filed under: Arbeit, Database, IT Infrastructure
28. January 2008, 16:55, by Mario Rimann

Night shift: Server move

Moving all servers of tilllate.com in one night?

Maybe you’ve read our short announcement on the tilllate website last week: We were offline for some planned maintenance.

Lots of servers…

In detail, we moved all servers to a new cage in the datacenter. We like to give you some insight, of what happened after switching off the tilllate webservers. (more…)

Filed under: IT Infrastructure
6. December 2007, 13:43, by Mario Rimann

Building the fundament of our Corporate Network

We’re currently building up a corporate network for tilllate. This is about having VPN secured connections between our locations (the office, the data center, mobile users), clear splitting of internal and external hosts. We’re realizing this project with strong support of Open Systems which are specialized in this topic.

After weeks of planning and hundreds or versions of the network layout, we could install the first stuff yesterday. The guys from Open Systems pre-configured all the devices and brought them to the data center - where Stefan and I met them to install it.

First step was to get an overview on all the devices and cables. Thank god the fence around our cage was not built yet and we had enough space to distribute everything on the floor and bring it into some order.

Getting an overview
(more…)

Filed under: IT Infrastructure
11. November 2007, 18:01, by Silvan Mühlemann

Squid and Mysql metric scripts for Ganglia

Ganglia Title imageAfter a long day of meetings and other tedious manager work the perfect way to relax is to code. The best is a mini-projects where you see your results after an hour or so. I call these tasks “Plausch-Projekte” (”plah-oosh project” =”fun projects”).

This week my plah-oosh projects were two metric tools for Ganglia. Besides Nagios Ganglia is the main monitoring tool for our cluster. We monitor something like 20 metrics like load, memory, disk usage, network activity.

Ciprian and Stefan recently built a script to monitor apache (bytes/sec, hits/sec, idle processes etc.) via the /server-status interface. Based on their work I hacked two scripts:

ganglia_mysql_metrics.php monitors multiple mysql parameters like queries/sec, slow queries/sec, threads connected:
Screenshot of mysql_* metrics in Ganglia

ganglia_squid_metrics.php reports regularly about squid metrics: Requests/sec, service time, available file descriptors:

Screenshot squid metrics in Ganglia

The scripts are quick and dirty code. Procedural. Not well documented. Does only read the mcast_port from the config file and ignores the rest. But it might be a good base to be used on your cluster too. Just call them every minute via the crontab.

Filed under: IT Infrastructure, PHP, Programming
3. October 2007, 21:09, by Silvan Mühlemann

Be our Gentoo-Guru!

Server close upSetup blade servers 40 and 41 via our standardized PXE based automatic installation process - Configure the Memcache extension and deploy it on our cluster - assist at the evaluation of a new VMWare solution - Program a new check for Nagios - Analyze Ganglia graphs - Optimize performance of a complex MySQL query - Give salesperson Raquel an advice on how to use the VPN software provided by Open Systems- Emerge a new PHP version via the portage system of Gentoo

If you’d enjoy doing these activities you should apply for the position of Linux Specialist. Along with our team of 13 developers and engineers you’ll help building Europe’s biggest nightlife website.

I am looking forward to meeting you!

Filed under: IT Infrastructure
11. March 2007, 20:23, by Silvan Mühlemann

Diät für die Foto-Tabelle

Orange on Diet“Silvan, das Hinzufügen von Fotos ist schweinelangsam am Weekend! Die Fotografen sind am jammern. Ich bekomme andauernd Anrufe. Mach was!”. So beklagten sich die Regionalmanager in den letzten Wochen.

Unsere Überwachungstool bestätigen die Situation: Wie aus dem Maschinengewehr wird mein Handy von Nagios mit SMS beschossen. Die graue Kurve, welche im Ganglia die Server-Load beschreibt, ist weit über der roten Linie. Moreti, unser Tool, um die Antwortzeit zu messen meldet mehrere Sekunden, um eine tilllate-Seite zu liefern.

Server-Load-Graph
(more…)

Filed under: IT Infrastructure, tilllate.com
28. February 2007, 15:38, by Stefan Rothenhofer

Server-Relocation - Teil 2 (Interxion)

InterxionErst vor kurzem sind wir mit unseren Servern von einem halben in ein komplett für uns gemietetes Rack umgezogen (Server-Relocation Teil 1). Das ist nur knapp 2 Monate her und doch mussten wir schon wieder unser ganze Equipment an einen anderen Ort transportieren.

Kurz zur Vorgeschichte. Wir hatten uns damals für das IXEurope (beherbergt auch das Telehouse) in Zürich entschieden, da es einen ungeheur guten Ruf und dementsprechende Bekanntheit erreicht hat. Auch dass alle grossen Carrier ihre Peerings in diesen Gebäuden verwalten hat dafür gesprochen und wir hatten ja im halben Rack durchaus gute Erfahrungen mit dem IX gemacht.
Voller Freue haben wir dann anfangs Jahr unser neues 1/1 Rack bezogen. Von da an haben die Probleme begonnen:

(more…)

Filed under: IT Infrastructure, tilllate.com
28. January 2007, 21:09, by Silvan Mühlemann

Replikation mit MySQL: Tricky!

DelfinPro Sekunde werden auf tilllate.com 5000 Abfragen von den Datenbank-Servern beantwortet. Wie können wir diese Last auf 30 Datenbank-Server verteilen? Mit Replikation. Aber auch nach fünf Jahren Erfahrung habe ich dieses Feature noch nicht ganz im Griff.

Auf Datenbank-Ebene besitzt tilllate.com vier Servergruppen mit unterschiedlichen Funktionen (= “horizontale Skalierung”): Werbung, Statistik, Chat und schliesslich der Rest der Website tilllate.com. Werbung, Statistik und Chat kommen mit einem einzelnen Datenbank-Server aus.

Der “Rest” macht 90% der Abfragen aus. Der Rest sind 27 MySQL Datenbank-Server. Auf diesen 27 Server befindet sich eine identische Kopie der Haupt-Datenbank. Damit dies so bleibt, muss jede Änderung der Datenbank (z.B. eine UPDATE-Query) wird über einen definierten Weg auf alle 27 Maschinen repliziert. Wir benutzen hier die Replikations-Features von MySQL.

Einfache Master-Slave-Replikation
(more…)

3. January 2007, 18:30, by Stefan Rothenhofer

Server-Relocation - Vom 1/2 ins 1/1 Rack

AufmacherOder was passiert wenn viele schöne Zugriffe einem zum aufstocken der Infrastruktur zwingen. Erfreulicherweise hat uns dies ein neues Rack beschert welches wir im Dezember beziehen durften.

Riv, Silvan und Ich (Stefan) machten uns deshalb eines Abends gegen 19:00 Uhr auf den Weg nach Zürich um alle Server vom alten 1/2 Rack ins neue 1/1 Rack zu migrieren. Glücklicherweise war dies im selben Raum zu finden wie schon das alte was uns eine mühsame Schlepperei ersparte und das umstecken des Uplinks zum Routineeingriff werden lies.
Der Plan war dabei wie folgt:

  1. Vorbereiten des neuen Racks (Connectivity, Strom und sonstige Kabel)
  2. Deaktivieren eines Blade Clusters und dem zugehörigen MySQL Master
  3. “Zügeln” des Blade Chassis und der Blades ins neue Rack
  4. Inbetriebnahme des Chassis nach sauberer Verkabelung
  5. Nachdem die Server am neuen Ort laufen das zweite Chassis abschalten
  6. Chassis 2 und alten Switch im neuen Rack montieren
  7. Umhängen des Uplinks vom alten zum neuen Rack
  8. Starten der Blades im Chassis 2 und überprüfen der Funktionen
  9. Aufräumen des alten Racks und sauberes Verkabeln des neuen Racks

Gross beschreiben möchte und muss ich vermutlich nicht, ich lasse lieber die Bilder für sich sprechen:

Unser altes 1/2 Rack ist ganz schön voll…
Altes Rack

(more…)

Filed under: IT Infrastructure
3. December 2006, 20:32, by Silvan Mühlemann

Memcached oder Cache_Lite - Wer ist schneller?

Stop WatchWochenende heisst für mich: Zeit für Plauschprojekte. Für die einen sind Plauschprojekte “Saufen bis zum Morgengrauen”. Für mich ist’s der Vergleich der Performance von memcached mit Cache_Lite. “Memcached natürlich 1000 mal schneller” höre ich sagen? Prüfen wir es doch.

Das Setup ist wie folgt: Unser Modell beinhaltet eine expensivePage.php. Auf einer realen Website wäre dies eine Seite, deren Erzeugung aufwändig ist. Zum Beispiel eine Regionenhomepage von tilllate. Diese Seite braucht 1 Sekunde, um erzeugt zu werden. Mit 10 Regionen gibt es 10 verschiedene Versionen dieser Seite (im folgenden Items genannt).
(more…)

Next Page »

© 2008 tilllate AG - Powered by WordPress