No. 689 - Stacking machine-learning models for anomaly detection: comparing AnaCredit to other banking datasets

Vai alla versione italiana Cerca nel sito

di Pasquale Maddaloni, Davide Nicola Continanza, Andrea del Monaco, Daniele Figoli, Marco di Lucido, Filippo Quarta e Giuseppe TurturielloApril 2022

Lo studio affronta il tema dell'identificazione di valori anomali nella rilevazione granulare dei prestiti erogati dalle banche dell'area euro (AnaCredit). Il metodo è basato sul confronto delle informazioni contenute in tale rilevazione con quelle più aggregate presenti in altre fonti (segnalazioni Balance Sheet Item e Financial Reporting). I risultati sono ottenuti tramite un algoritmo che combina le previsioni ("stacking") formulate da diversi algoritmi di machine learning.

La metodologia proposta consente di identificare in modo più accurato i potenziali valori anomali presenti nella rilevazione AnaCredit rispetto ai singoli modelli che vengono combinati. Inoltre è agevole determinare la causa dell'anomalia in quanto il controllo è ricondotto a un esercizio di confronto tra AnaCredit e altre basi dati.

Testo della pubblicazione