N. 689 - "Stacking" di modelli di machine-learning per l'identificazione delle anomalie in AnaCreditattraverso una comparazione con altre rilevazioni di dati bancari

Go to the english version Cerca nel sito

di Pasquale Maddaloni, Davide Nicola Continanza, Andrea del Monaco, Daniele Figoli, Marco di Lucido, Filippo Quarta e Giuseppe Turturielloaprile 2022

Lo studio affronta il tema dell'identificazione di valori anomali nella rilevazione granulare dei prestiti erogati dalle banche dell'area euro (AnaCredit). Il metodo è basato sul confronto delle informazioni contenute in tale rilevazione con quelle più aggregate presenti in altre fonti (segnalazioni Balance Sheet Item e Financial Reporting). I risultati sono ottenuti tramite un algoritmo che combina le previsioni ("stacking") formulate da diversi algoritmi di machine learning.

La metodologia proposta consente di identificare in modo più accurato i potenziali valori anomali presenti nella rilevazione AnaCredit rispetto ai singoli modelli che vengono combinati. Inoltre è agevole determinare la causa dell'anomalia in quanto il controllo è ricondotto a un esercizio di confronto tra AnaCredit e altre basi dati.

Testo della pubblicazione