Wie REWE mit Apache Kafka die digitale Transformation meistert

Ob beim Online-Einkauf, beim Self-Checkout im Markt oder bei der Belieferung nach Hause: Fast jeder Deutsche hat regelmäßig mit REWE zu tun. Was die wenigsten wissen: Hinter den Kulissen sorgt Apache Kafka dafür, dass alles reibungslos läuft. Paul Puschmann und Patrick Wegner geben Einblicke in die technologische Transformation eines der größten deutschen Einzelhändler.

REWE ist für die meisten Menschen ein klassischer Supermarkt. Was macht ihr im Bereich Datenverarbeitung?

Paul Puschmann: Wir bewegen uns in zwei Welten: Zum einen haben wir den klassischen stationären Handel mit unseren Märkten und Logistikzentren. Zum anderen sind wir mit unserem Online-Shop, dem Lieferservice und unseren Apps stark digital aufgestellt. Besonders im digitalen Bereich verarbeiten wir große Datenmengen in Echtzeit – von Produktinformationen über Bestellungen bis hin zu Marktdaten.

Beeindruckende Datenmengen:

über 90.000 Nachrichten pro Sekunde

werden von REWE in Echtzeit verarbeitet.

Wozu braucht ihr da Kafka?

Patrick Wegner: Kafka ist für uns wie ein digitales Nervensystem. Es verbindet unsere verschiedenen Services und ermöglicht, dass Daten in Echtzeit dort ankommen, wo sie gebraucht werden. Wenn zum Beispiel jemand im Markt den Self-Checkout nutzt oder online eine Bestellung aufgibt, müssen viele Systeme koordiniert zusammenarbeiten. Kafka macht das möglich.

Über welche Datenmengen reden wir?

Patrick Wegner: Allein auf einem unserer Cluster verarbeiten wir in Spitzenzeiten bis zu 90.000 Nachrichten pro Sekunde. Und das ist nur einer von mehreren Clustern. Was besonders beeindruckend ist: Trotz dieser enormen Datenmengen läuft das System sehr ressourcenschonend und stabil.

Über Paul Puschmann: Paul Puschmann ist seit 2014 bei REWE digital tätig. Er begleitete als IT Operations Engineer den Aufbau des Lebensmittel-Lieferservices und begleitete die Integration von Apache Kafka. Heute arbeitet er im Cloud Center of Excellence und treibt die digitale Transformation des Unternehmens voran.

Über Patrick Wegner: Patrick Wegner arbeitet im Integration Platform Team bei REWE digital mit Fokus auf Apache Kafka. Er ist verantwortlich für den Betrieb und die Weiterentwicklung der Kafka-Infrastruktur, die zentrale Komponente für REWEs digitale Services wie Online-Shop, Apps und Self-Checkout-Systeme.

Was bedeutet das konkret für die Kunden?

Paul Puschmann: Ein gutes Beispiel ist unser mobiler Self-Checkout: Kunden können Produkte selbst scannen und bezahlen, ohne an der Kasse anzustehen. Dahinter steckt ein komplexes System aus Echtzeitdaten, das über Kafka gesteuert wird. Auch wenn Sie online bestellen, sorgt Kafka dafür, dass alle beteiligten Systeme – vom Warenwirtschaftssystem bis zur Auslieferung – koordiniert zusammenarbeiten.

Warum habt ihr euch für Kafka entschieden?

Paul Puschmann: Wir haben 2015 mit Kafka begonnen, als wir unseren Online-Shop modernisiert haben. Der große Vorteil von Kafka ist seine Flexibilität: Wir können neue Features entwickeln und alte Systeme parallel weiterlaufen lassen. Das ermöglicht uns eine schrittweise Modernisierung ohne große Systemausfälle.

Klingt nach einer großen technischen Herausforderung…

Patrick Wegner: Interessanterweise ist Kafka selbst erstaunlich "langweilig" – und das im positiven Sinne. Es läuft einfach stabil. Die eigentliche Herausforderung liegt im Drumherum: Wie machen wir das System für Entwickler einfach nutzbar? Wie gestalten wir die Zugriffsrechte? Wie stellen wir sicher, dass Kafka optimal eingesetzt wird?

client-quote-img

Kafka ist für uns wie ein digitales Nervensystem. Es verbindet unsere verschiedenen Services und ermöglicht, dass Daten in Echtzeit dort ankommen, wo sie gebraucht werden.

Patrick Wegner
Integration Platform Team, REWE digital

Welche Rolle spielt Kafka in eurer zukünftigen IT-Strategie?

Paul Puschmann: Kafka ist für uns die Brücke zwischen der klassischen IT-Welt und modernen Microservice-Architekturen. Neue Anwendungen bauen wir direkt mit Kafka auf. Bestehende Systeme migrieren wir Schritt für Schritt, wenn es einen klaren Mehrwert gibt. Das ist eine strategische Architekturentscheidung.

Was war bisher die größte Herausforderung im Betrieb?

Patrick Wegner: In den Jahren des Betriebs hatten wir nur zwei nennenswerte technische Probleme: Einmal einen fehlerhaften Konfigurationseintrag im Zookeeper, verursacht durch unzureichende Validierung eines externen Tools. Der zweite Fall waren Performance-Probleme durch Java Garbage Collection. Beide Fälle konnten wir durch gezielte Konfigurationsanpassungen lösen. Das zeigt, wie stabil das System grundsätzlich läuft.

Bewiesene Stabilität:

Nur 2 technische Probleme

in 10 Jahren des Kafka-Betriebs.

Welche Entwicklungen wünscht ihr euch für die Zukunft?

Patrick Wegner: Eine bessere native Unterstützung für Schema-Validierung direkt auf Broker-Ebene wäre sehr hilfreich. Das würde uns ermöglichen, Constraints direkt auf der Broker-Ebene durchzusetzen, statt in vorgelagerten Komponenten. Damit könnten wir bessere Garantien für die Datenqualität in unseren Topics erreichen.

Paul Puschmann: Vor ein paar Jahren hätte ich noch gesagt, dass ich mir bessere Metriken wünsche, aber das wurde mittlerweile durch sehr gute Metric-Exporter erfüllt. Was mir jetzt am wichtigsten ist: Dass Kafka seine bisherigen Stärken beibehält. Wir nutzen das System seit Version 0.8, und die Tatsache, dass wir bei unseren Clients nicht bei jedem Update umbauen müssen, ist ein enormer Vorteil. Diese Stabilität und Rückwärtskompatibilität sollten unbedingt erhalten bleiben.

Die REWE Group ist eine der führenden Handels- und Touristikgruppen in Deutschland und Europa. Im Jahr 1927 gegründet, erzielte die REWE Group 2023 einen Gesamtaußenumsatz von über 90 Milliarden Euro. Mit ihren über 380.000 Beschäftigten verbindet REWE traditionellen Einzelhandel mit modernsten digitalen Services. Der Online-Shop, mobile Self-Checkout und der Lieferservice sind Beispiele für die digitale Transformation des Unternehmens.

Und zu guter Letzt: Ihr kennt unsere Kafka-Trainings seit einigen Jahren. Was überzeugt euch an diesem Schulungsansatz?

Patrick Wegner: Die Art des Trainings ist ja sehr unterschiedlich von Mensch zu Mensch - es gibt Menschen, die mögen frontalen Unterricht, andere bevorzugen interaktives Erarbeiten. Was mir bei der Zusammenarbeit mit Anatoly besonders gut gefällt, ist genau diese interaktive Herangehensweise. Diese Art des Lernens und der Wissensvermittlung funktioniert für uns sehr gut.

Vielen Dank euch für das interessante Gespräch

Hallo, ich bin Anatoly! Ich liebe es, bei Menschen das Funkeln in den Augen zu wecken. Als Apache Kafka Experte und Buchautor bringe ich seit über einem Jahrzehnt IT zum Leben - mit Leidenschaft statt Langeweile, mit Erlebnissen statt endlosen Folien.