Die Neobank Monzo baut ein gobernantes Data-Mesh für 100 Teams und 12000 dbt-Modelle
InfoQ Homepage News Die Neobank Monzo baut ein gobernantes Data-Mesh für 100 Teams und 12000 dbt-Modelle AI, ML & Data Engineering Shipping Faster, Breaking More: Rethinking Delivery Systems in the Age of AI (Webinar May 28th) Die Neobank Monzo baut ein gobernantes Data-Mesh für 100 Teams und 12000 dbt-Modelle May 17, 2026 3 min read by Renato Losio Write for InfoQ Feed your curiosity. Hilf 550k+ globalen Senior-Entwicklern jeden Monat, sich auf dem neuesten Stand zu halten. Kontaktiere uns Höre dir dieses Artikel - 0:00 Audio bereit zum Abspielen Dein Browser unterstützt das Audio-Element nicht. 0:00 0:00 Normal 1.25x 1.5x Like Leseliste Monzo hat ihr Datenlager neu gestaltet, um mehr als 100 Teams zu unterstützen, die an 12.000 dbt-Modellen arbeiten. Durch die Einführung eines sogenannten "Meshy"-Ansatzes hat Monzo die Kosten des Datenlagers um 40% reduziert und die Datenliefergeschwindigkeit um 25% verbessert. Im letzten Jahr hat Monzo, eine britische digitale Bank, ihre Datenplattform umgestellt, um umfassende Modellierungsschichten, explizit deklarierte Schnittstellenmodelle für die Abhängigkeiten zwischen den Daten der Teams und CI-gestützte Validierung der Struktur, Bezeichnung und Zugriffsmuster durchzuführen. Die Migration hat Tausende von dbt-Modellen abgedeckt und Hunderte von regierten Schnittstellen eingeführt, um redundante Abfragen und Rechenaufgaben zu reduzieren, die Datenlieferzeiten zu verbessern und die Kostenwachstum des Datenlagers umzukehren. Während jedes Team seine eigenen Datenmodelle besitzt und pflegt, unterstützt Monzo die verteilte Eigentümerschaft durch automatisierte Wächter und gemeinsame Werkzeuge. Antonia Badarau, Irina Mugford und Massimo Frangiamore, Analytiker bei Monzo, erklären das Problem: Bei Monzo arbeiten mehr als 100 unabhängige und autorisierte Teams an unserem Datenlager mit 12.000+ dbt-Modellen. Die Gesundheit der Daten ist Eigentum aller dieser Teams. Dieser Art der verteilten Eigentümerschaft ist mächtig, aber auch schwierig zu erreichen auf Skalenebene. Darüber hinaus wird die Frage gestellt: Wie können wir sicherstellen, dass die Ergebnisse immer noch effizient, konsistent und hochwertig sind? Die dbt-Modelle sind SQL-Abfragen, die Rohdaten in strukturierte Datensätze umwandeln, die als modulare, wiederverwendbare Komponenten für die Erstellung und Wartung von Datenpipelines konzipiert sind. Monzo hat drei Prinzipien für ihre Datenarchitektur definiert: klare Standards festlegen, die Datenverteilung durch explizite Schnittstellen formalisieren und auf Automatisierung und CI-Validierung setzen, um die Qualität gegenüber manueller Überprüfung zu gewährleisten. Die Bank strukturiert ihre Datenmodelle in vier Schichten: automatisierte Landemodelle, die Rohdaten planieren, generierte Normalisierungsmodelle, die Entitäten mit vollständiger Geschichte darstellen, logische Modelle, in denen die Geschäftslogik Entitäten kombiniert und Präsentationsmodelle, die für spezifische downstream-Anwendungen personalisiert sind. Quelle: Monzo-Blog Das Team setzt dann die Kohärenz durch das sogenannte Modelgen, eine Kommandozeilenwerkzeug, das SQL- und YAML-Modelle aus einer Objektdefinition generiert, und durch CI-gestützte Datenstandards, die Struktur, Konventionen und beste Praktiken bewerten. Luke Briscoe, Engineering Director bei Monzo Bank, schreibt: Scaling data in any fast-growing organisation isn't easy, never mind a bank (...) I'm not aware of many companies that run tooling like this (or at least that publicly talk about it!) Mateusz Ulas, Gründer von Expeditious Software, kommentiert: Treating data interfaces as first-class code is still weirdly rare. Most places I see rely on docs and hope for the best. Wiring standards into CI is what actually lands the improvement. Laut dem Team halten die klaren Datenlevel, die stabilen Schnittstellen zwischen den Datensets und die automatisierten Überprüfungen in CI den System konsistent, während die Teams unabhängig arbeiten und die Kosten des Datenlagers und die Verarbeitungszeiten reduzieren. Monzo setzt die Datenqualität und -konsistenz durch die Anforderung, dass jedes Modell eine eindeutige Schlüssel definiert, Frischeprüfungen enthält, inkremental durchgeführt wird, einen Eigentümersteam deklariert, Dokumentation bereitstellt und strenge Bezeichnungs- und Metadatengebote validiert. Quelle: Monzo-Blog Badarau, Mugford und Frangiamore fügen hinzu: Wir sind derzeit etwa 30% durch eine Unternehmensweite
Kommentare (0)
Login or Register to apply