La neobanca Monzo costruisce un data mesh governato per 100 team e 12000 modelli dbt
InfoQ Homepage News La neobanca Monzo costruisce un data mesh governato per 100 team e 12000 modelli dbt AI, ML & Data Engineering Shipping Faster, Breaking More: Rethinking Delivery Systems in the Age of AI (Webinar May 28th) La neobanca Monzo costruisce un data mesh governato per 100 team e 12000 modelli dbt May 17, 2026 3 min read by Renato Losio Write for InfoQ Feed your curiosity. Help 550k+ global senior developers each month stay ahead. Get in touch Listen to this article - 0:00 Audio ready to play Your browser does not support the audio element. 0:00 0:00 Normal 1.25x 1.5x Like Reading list Monzo ha recentemente ridisegnato il suo data warehouse per supportare più di 100 team che lavorano su oltre 12000 modelli dbt. Introducendo un approccio chiamato "meshy", Monzo ha ridotto i costi del data warehouse del 40% e migliorato la velocità di consegna dei dati del 25%. Nel corso dell'ultimo anno, Monzo, una banca digitale britannica, ha ricostruito la sua piattaforma dati attorno a livelli di modellazione definiti, modelli di interfaccia dichiarati esplicitamente per le dipendenze dei dati tra team e validazione di struttura, denominazione e accesso tramite CI. La migrazione ha coperto migliaia di modelli dbt e ha introdotto centinaia di interfacce governate, riducendo le query ridondanti e la ricomputazione, migliorando i tempi di arrivo dei dati e invertendo la crescita dei costi del data warehouse. Mentre ogni team possiede e mantiene i propri modelli dati, Monzo supporta la proprietà distribuita attraverso guardrail automatizzati e strumenti condivisi. Antonia Badarau, Irina Mugford e Massimo Frangiamore, ingegneri di analisi a Monzo, spiegano il problema: A Monzo, più di 100 team indipendenti e autorizzati contribuiscono al nostro data warehouse di 12.000+ modelli dbt. La salute dei dati è di proprietà di tutti questi team. Questo tipo di proprietà distribuita è potente, ma è anche difficile da ottenere a livello di scala. Inoltre, poiché il codice assistito da AI diventa la norma e tutti possono contribuire ai progetti dbt di produzione, la domanda diventa: come assicurarsi che gli output siano ancora performanti, coerenti e di alta qualità? I modelli dbt sono query SQL che trasformano i dati bruti in insiemi strutturati, progettati come componenti modulari e riutilizzabili per la costruzione e la manutenzione delle pipeline dei dati. Monzo ha definito tre principi per la sua architettura dati: imporre standard chiari, formalizzare la condivisione dei dati attraverso interfacce esplicite e affidarsi all'automazione e alla validazione di CI per garantire la qualità rispetto alla revisione manuale. La banca struttura i suoi modelli dati in quattro livelli: modelli di atterraggio automatizzati che flattano gli eventi bruti, modelli normalizzati generati che rappresentano entità con storia completa, modelli logici dove la logica di business combina entità e modelli di presentazione personalizzati per usi specifici downstream. Fonte: blog Monzo Il team poi impone la coerenza attraverso il cosiddetto Modelgen, uno strumento di riga di comando che genera modelli SQL e YAML da una definizione di oggetto, e attraverso la validazione di CI dei dati che valuta struttura, convenzioni e migliori pratiche. Luke Briscoe, direttore di ingegneria a Monzo Bank, scrive: Scaling data in any fast-growing organisation isn't easy, never mind a bank (...) I'm not aware of many companies that run tooling like this (or at least that publicly talk about it!) Mateusz Ulas, fondatore di Expeditious Software, commenta: Treating data interfaces as first-class code is still weirdly rare. Most places I see rely on docs and hope for the best. Wiring standards into CI is what actually lands the improvement. Secondo il team, i livelli di dati chiari, le interfacce stabili tra i dati set e le verifiche automatizzate in CI mantengono il sistema coerente, consentendo ai team di lavorare indipendentemente mentre riducono i costi del data warehouse e i tempi di elaborazione. Monzo impone la qualità e la coerenza dei dati richiedendo a ogni modello di definire una chiave univoca, includere test di freschezza, eseguire incrementalmente di default, dichiarare un team di proprietà, fornire documentazione e seguire convenzioni di denominazione e metadati rigorose validate in CI. Fonte: blog Monzo Badarau, Mugford e Frangiamore aggiungono: Siamo attualmente circa il 30% attraverso una piattaforma dati aziendale
Commenti (0)
Accedi o Registrati per candidarti