N. 636 - Il processo di ponderazione nell'indagine sui bilanci delle famiglie italiane

Go to the english version Cerca nel sito

di Ivan Faiella e Romina Gambacorta giugno 2007

Questo lavoro approfondisce alcune problematiche metodologiche relative all’indagine sui bilanci delle famiglie italiane, condotta ogni due anni dalla Banca d’Italia; in particolare, gli autori si concentrano sullo schema di ponderazione dei dati, valutando l’impatto delle procedure adottate sui risultati dell’indagine.

La selezione del campione di famiglie incluso nell’indagine prevede una procedura a due stadi. Nel primo stadio vengono scelti i comuni coinvolti nell’indagine: l’insieme dei comuni italiani viene dapprima suddiviso in base alla regione e alla classe di ampiezza demografica; successivamente, all’interno di ogni gruppo così definito (strati) vengono individuati i comuni inclusi nell’indagine. Nel secondo stadio del campionamento vengono estratte casualmente le famiglie da intervistare, tra quelle residenti nei comuni selezionati.

Ai dati di ciascun individuo delle famiglie intervistate viene attribuito un peso, che tiene conto della probabilità per la famiglia di essere inclusa nel campione e di partecipare all’indagine. I pesi finali garantiscono inoltre la rappresentatività dei risultati dell’indagine rispetto a quattro caratteristiche della popolazione: il sesso, la classe di età, l’area geografica e la dimensione del comune di residenza.

L’uso dei pesi, se da un lato consente di ottenere statistiche aggregate (stimatori) non distorte (ovvero che non si discostano in media dai parametri dell’insieme delle famiglie italiane), dall’altro provoca un aumento della loro variabilità. Bisogna pertanto utilizzare un criterio che tenga conto di tali aspetti, consentendo di bilanciare costi e benefici della ponderazione.

In questo lavoro gli autori presentano lo schema di ponderazione adottato nell’indagine, valutando l’impatto su distorsione e varianza di alcuni stimatori (utilizzando la stima dell’errore quadratico medio).

I risultati mostrano che la crescita nella variabilità indotta dall’uso dei pesi è più che compensata dalla riduzione nella distorsione degli stimatori. Ciò si verifica per tutte le variabili analizzate, anche quando l’analisi è relativa a sottocampioni, ad esempio le ripartizioni geografiche. Il guadagno ottenuto con la ponderazione in termini di minor errore quadratico medio è evidente, in particolare, per le principali variabili dell’indagine, quali ad esempio il reddito, la spesa e la ricchezza.

Inoltre, il lavoro propone uno schema di pesi per l’analisi della componente longitudinale del campione, ovvero le famiglie che partecipano a più indagini; queste ultime rappresentano, tipicamente, circa la metà dei dati di ciascuna indagine. Il sistema di ponderazione proposto tiene conto del fatto che queste famiglie passano attraverso un differente processo di selezione (poiché estratte tra famiglie già intervistate nel passato) e sono caratterizzate da comportamenti diversi in termini di partecipazione all’indagine (perché mostrano una maggiore propensione alla partecipazione). I risultati dell’analisi mostrano che in alcuni casi l’incremento della varianza connesso con l’utilizzo dei pesi proposti può risultare significativo, sconsigliandone l’adozione.

Testo della pubblicazione