N. 739 - L’uso dei pesi campionari nelle analisi di regressione

Go to the english version Cerca nel sito

di Ivan Faiellafebbraio 2010

Le indagini statistiche prevedono procedure complesse per selezionare le unità oggetto di analisi (stratificazione della popolazione, campionamento a più stadi, ecc.). In sede di analisi dei dati a ciascuna unità del campione viene attribuito un peso che tiene conto sia della probabilità di inclusione sia della mancata risposta nel suo strato. L’uso dei pesi consente di ottenere stimatori non distorti ma può indurre un aumento della loro variabilità.

In questo lavoro si confrontano le stime per regressione che adoperano i pesi campionari (design based – DB) con quelle che non ne tengono conto (model based – MB).

 I fautori degli stimatori DB sostengono che l’impiego dei pesi consente di dare robustezza a problemi di cattiva specificazione dei modelli (ad esempio per la presenza di variabili omesse): in questo caso i pesi sono l’elemento principale per la costruzione di una classe di stimatori asintoticamente corretti (c.d. stimatori di tipo Horvitz-Thompson). I sostenitori dell’approccio MB (il tradizionale approccio econometrico) sottolineano il rischio che, in presenza di modelli non distorti, l’utilizzo dei coefficienti di ponderazione porti alla costruzione di intervalli di confidenza troppo ampi.

Nel lavoro si propone di affidare la scelta tra i due approcci a procedure che valutano se e quanto le informazioni contenute nel peso contribuiscano alla spiegazione della variabile oggetto di studio. Si verifica, in altri termini, se il modello può “ignorare” il disegno del campione.

 Si mostra che, qualunque sia l’approccio adottato, per una valutazione della varianza degli stimatori è bene considerare tutte le informazioni sul disegno del campione e il processo di costruzione dello stimatore. Per scegliere l’approccio da adottare, è possibile ricorrere a una batteria di test econometrici che valutano se l’informazione contenuta nei pesi sia statisticamente importante nello spiegare il fenomeno analizzato, anche una volta che si sia tenuto conto di una serie di fattori di controllo.

Un’applicazione delle procedure sopra descritte a due indagini condotte dalla Banca d’Italia - che si differenziano per il grado di complessità dei loro piani di campionamento - sembrerebbe indicare la maggior robustezza degli stimatori che utilizzano i pesi campionari.

Testo della pubblicazione