N. 547 - Il controllo della qualità dei dati bancari granulari: un approccio sperimentale basato sul machine learning

Go to the english version Cerca nel sito

di Fabio Zambuto, Maria Rosaria Buzzi, Giuseppe Costanzo, Marco Di Lucido, Barbara La Ganga, Pasquale Maddaloni, Fabio Papale e Emiliano Sveziamarzo 2020

Il lavoro propone una metodologia innovativa, basata sull'algoritmo di apprendimento supervisionato Quantile Regression Forest, per l'individuazione automatica di potenziali valori anomali (outlier) nei dati che gli intermediari bancari e finanziari inviano alla Banca d'Italia. L'analisi empirica riguarda le informazioni granulari sulle carte di debito acquisite nell'ambito della rilevazione sui servizi di pagamento; per tali informazioni il sistema dei controlli di qualità è particolarmente sfidante da un punto di vista metodologico e oneroso sotto l'aspetto della gestione.

La metodologia permette di definire in modo automatico gli "intervalli di accettazione" per i dati trasmessi dagli intermediari tramite la stima di specifiche soglie che tengono conto delle caratteristiche dei segnalanti; tali soglie si aggiornano automaticamente a mano a mano che vengono acquisiti nuovi dati. L'analisi empirica mostra che la procedura proposta identifica un numero significativo di outlier aggiuntivi rispetto a quelli intercettati tramite l'attuale sistema dei controlli; il riscontro diretto con gli intermediari segnala che l'incidenza degli errori segnaletici effettivi sul totale dei potenziali outlier è elevata, a conferma della buona performance dell'algoritmo.

Testo della pubblicazione