Il lavoro propone una metodologia innovativa, basata sull'algoritmo di apprendimento supervisionato Quantile Regression Forest, per l'individuazione automatica di potenziali valori anomali (outlier) nei dati che gli intermediari bancari e finanziari inviano alla Banca d'Italia. L'analisi empirica riguarda le informazioni granulari sulle carte di debito acquisite nell'ambito della rilevazione sui servizi di pagamento; per tali informazioni il sistema dei controlli di qualità è particolarmente sfidante da un punto di vista metodologico e oneroso sotto l'aspetto della gestione.
La metodologia permette di definire in modo automatico gli "intervalli di accettazione" per i dati trasmessi dagli intermediari tramite la stima di specifiche soglie che tengono conto delle caratteristiche dei segnalanti; tali soglie si aggiornano automaticamente a mano a mano che vengono acquisiti nuovi dati. L'analisi empirica mostra che la procedura proposta identifica un numero significativo di outlier aggiuntivi rispetto a quelli intercettati tramite l'attuale sistema dei controlli; il riscontro diretto con gli intermediari segnala che l'incidenza degli errori segnaletici effettivi sul totale dei potenziali outlier è elevata, a conferma della buona performance dell'algoritmo.