N. 662 - L’effetto del disegno campionario nell’indagine sui bilanci delle famiglie italiane

I metodi tradizionalmente impiegati per l’analisi statistica si basano sull’ipotesi che le osservazioni campionarie siano estratte dalla popolazione di riferimento utilizzando il campionamento casuale semplice (CCS) con ripetizione. In realtà la selezione dei campioni si basa sempre su tecniche di campionamento più complesse che — ad esempio — dividono la popolazione prima dell’estrazione delle unità in gruppi omogenei (stratificazione) oppure procedono a estrarre non singoli elementi del campione ma gruppi di unità contigue (cluster), allo scopo di facilitare la rilevazione e limitarne i costi.

Affinché gli stimatori siano corretti (ossia coincidano in media con il parametro della popolazione di riferimento) è necessario, data la complessità del procedimento di selezione, che includano i pesi campionari. Inoltre, nel valutare la variabilità degli stimatori è necessario considerare in che modo i processi casuali abbiano determinato la selezione delle unità nel campione finale.

Questo lavoro analizza come il disegno di campionamento influenzi la stima della variabilità degli stimatori, utilizzando i dati dell’indagine sui bilanci delle famiglie (IBF). Il disegno di campionamento dell’IBF prevede una procedura di selezione a due stadi. Le unità di primo stadio sono i comuni (cluster di famiglie); le unità di secondo stadio sono le famiglie. Prima di procedere all’estrazione delle unità di primo stadio, queste vengono suddivise in base alla regione e alla classe di ampiezza demografica (stratificazione delle unità di primo stadio).

Per la stima della varianza campionaria, un confronto dei metodi disponibili e delle loro proprietà utilizzando i dati IBF conferma i vantaggi dell’adozione della tecnica Jackknife Repeated Replication. Questo metodo consente infatti di stimare la varianza di stimatori complessi tenendo conto, meglio di altri approcci, del piano di campionamento.

I principali risultati sono i seguenti. Innanzitutto, le formule basate sull’ipotesi di campionamento casuale semplice sottostimano in modo significativo l’effettiva varianza degli stimatori. In secondo luogo, la distorsione degli stimatori, se questi non includono i pesi campionari, risulta rilevante. Nell’insieme, le caratteristiche dell’“universo” delle famiglie italiane che si deducono dall’osservazione del campione dell’IBF possono risultare errate in misura non trascurabile quando la complessità del disegno campionario non venga adeguatamente presa in considerazione.