Come viene selezionato il campione?

Il disegno di campionamento dell'indagine prevede una procedura di selezione a due stadi. Le unità di primo stadio sono i comuni; le unità di secondo stadio sono le famiglie. Prima di procedere all'estrazione delle unità di primo stadio, queste vengono stratificate in base alla regione e alla classe di ampiezza demografica.

All'interno di ogni strato i comuni nei quali effettuare le interviste sono selezionati includendo tutti quelli con popolazione superiore ai 40.000 abitanti (comuni auto-rappresentativi) ed estraendo i comuni rimanenti con una modalità di selezione che assegna ai comuni di maggiore dimensione una probabilità più elevata di essere inclusi nel campione. Nella seconda fase, per ciascun comune selezionato, le famiglie da intervistare vengono estratte casualmente dalle liste anagrafiche.

Per incrementare l'efficienza del disegno, a partire dall'edizione sul 2020, le unità di secondo stadio sono state estratte dopo aver definito un'opportuna stratificazione basata sulla condizione reddituale e di indebitamento delle famiglie (stratificazione delle unità di secondo stadio).

Per maggiori dettagli si veda il fascicolo Metodi e fonti: note metodologiche R. Gambacorta e E. Porreca, Bridging techniques in the redesign of the Italian survey on household income and wealth, Banca d’Italia, Questioni di economia e finanza, di prossima pubblicazione.

Quale uso posso fare dei dati?

I dati elementari anonimizzati dell'Indagine sono distribuiti a fini di ricerca.

L'uso dei dati avviene sotto la piena e sola responsabilità dell'autore medesimo e non coinvolge questo Istituto. L'uso dei dati elementari dell'Indagine va indicato con la citazione "Banca d'Italia, Indagine sui bilanci delle famiglie italiane", riportando la versione dell'archivio storico o annuale utilizzato.

Al fine di consentire la raccolta del materiale bibliografico, i riferimenti dei lavori che ricorrono ai dati dell'Indagine devono essere inviati a indagini.famiglie@bancaditalia.it .

Come posso accedere ai dati dell'indagine?

I dati sono distribuiti in archivi annuali (a partire dall'indagine del 1989) e in un archivio storico (dall'indagine del 1977 a quella più recente) nei formati ASCII (comma separated values), SAS, Stata (versione 7 o superiore) compresso. Gli archivi sono corredati di note esplicative sui loro contenuti (metodologie, classificazioni, definizioni).

Per accedere agli archivi visitare la sezione del sito Distribuzione dei microdati.

Che cosa sono i dati dell'Household Finance and Consumption Survey (HFCS)?

L'Household Finance and Consumption Survey (HFCS) è una indagine campionaria armonizzata su ricchezza, reddito e consumi delle famiglie dell'area dell'euro condotta dalle Banche Centrali Nazionali. Per l'Italia, sono inclusi i dati dell'Indagine sui bilanci delle famiglie italiane opportunamente armonizzati (es. redditi al lordo delle imposte e dei contributi).

Le Banche Centrali hanno rilevato, con una metodologia per quanto possibile omogenea e secondo definizioni armonizzate, le variabili necessarie a ricostruire i bilanci delle famiglie sia in termini di consistenze sia di flussi, con particolare attenzione alle componenti della ricchezza.

La documentazione completa è disponibile sulla pagina del progetto.

Come posso accedere ai dati dell'Household Finance and Consumption Survey (HFCS)?

I dati elementari anonimi sono a disposizione degli studiosi per finalità di ricerca su domanda (si veda istruzioni nella pagina internet http://www.ecb.europa.eu/pub/economic-research/research-networks/html/researcher_hfcn.en.html). I dati elementari della sola componente italiana e la relativa documentazione sono liberamente disponibili nell'apposita sezione del sito della Banca d'Italia.

Chi è la persona di riferimento all'interno di una famiglia?

La persona di riferimento (PR) è il responsabile dell'economia familiare o comunque la persona più informata tra tutte le persone che componevano la famiglia nell'anno a cui si riferisce l'indagine. Una volta individuato dall'intervistatore, la PR fornisce tutte le informazioni relative alla famiglia e quelle relative ai singoli componenti qualora questi siano assenti. Nei file di dati individuali la variabile NORD indica il componente a cui si riferiscono le informazioni. Per la persona di riferimento la variabile NORD è sempre uguale a 1.

Chi sono i componenti della famiglia IBF?

La famiglia IBF comprendere tutte le persone che abitavano normalmente nella stessa abitazione al 31 dicembre dell'anno di riferimento dell'indagine, mettendo in comune almeno una parte del reddito percepito. Sono considerati anche gli eventuali assenti temporanei (persone in ferie, assenti temporanei per studio, ecc.) ed eventuali altri non parenti che comunque vivevano stabilmente nella famiglia al 31 dicembre dell'anno di riferimento dell'indagine. Non sono pertanto considerati gli eventuali nati nell'anno successivo all'anno di riferimento dell'indagine, studenti fuori sede e in generale tutti coloro che hanno vissuto solo una parte dell'anno nell'abitazione della famiglia intervistata.

Come si agganciano le famiglie panel?

Le informazioni relative alle famiglie panel possono essere tra loro raccordate mediante la variabile NQUEST (numero identificativo della famiglia), infatti la famiglia che viene rilevata più volte mantiene tale codice.

Il raccordo tra gli individui può essere effettuato mediante la variabile NORDP (nell'archivio CARCOM) che indica il numero d'ordine (NORD) che il soggetto aveva nell'indagine precedente.

Va comunque tenuto presente che da una rilevazione all'altra è possibile non ritrovare gli stessi componenti all'interno della stessa famiglia; in particolare non si ritroveranno gli individui morti o usciti per altri motivi dalla famiglia mentre si ritroveranno gli individui nati e quelli entrati nel periodo tra le due rilevazioni. Tali circostanze sono rilevate in un'apposita sezione del questionario. Nei file CARCOM, i soggetti usciti dalla famiglia sono semplicemente assenti nella rilevazione successiva (cioè si rilevano per differenza) mentre i soggetti entrati sono presenti ma con un codice NORDP pari a missing "." .

Come viene calcolata la ricchezza netta familiare?

L'indagine IBF nasce per rilevare le componenti del reddito e della ricchezza delle famiglie. Tutte le componenti dei due aggregati sono rilevate al netto delle tasse e delle imposte.

La ricchezza netta (W) è calcolata come differenza tra il le attività e le passività delle famiglie, secondo il seguente piano di aggregazione. Per maggiori dettagli si veda il fascicolo Metodi e fonti: note metodologiche.

Attività:

  • Le attività reali derivanti da immobili, aziende e oggetti di valore;
  • Le attività finanziarie (depositi, titoli di Stato e altri titoli, crediti commerciali e altri crediti verso parenti e amici).

Passività:

  • Le passività finanziarie (debito residuo verso banche e società finanziarie, debiti commerciali, debiti verso altre famiglie).

La variabile W è disponibile nel file RICFAMxx degli archivi annuali, dove xx indicano le ultime due cifre dell'anno cui l'indagine si riferisce, e nel file RICF dell'archivio storico.

Come viene calcolato il reddito netto familiare?

L'indagine IBF nasce per rilevare le componenti del reddito e della ricchezza delle famiglie. Tutte le componenti dei due aggregati sono rilevate al netto delle tasse e delle imposte.

Il reddito disponibile netto familiare (variabile Y) è dato dalla somma dei redditi netti da lavoro dipendente, autonomo e da pensione di tutti i singoli componenti. Ad essi vanno aggiunti eventuali trasferimenti e redditi netti da capitale reale e finanziario. Per maggiori dettagli si veda il fascicolo Metodi e fonti: note metodologiche.

La variabile Y è disponibile nei file RFAMxx e RISFAMxx degli archivi annuali, dove xx indicano le ultime due cifre dell'anno a cui l'indagine si riferisce, e nei file RFAM e CONS dell'archivio storico.

Analogamente, nei file RPERxx per gli archivi annuali e RPER per l'archivio storico sono disponibili i dati relativi ai redditi personali di ciascuno degli individui della famiglia. I redditi attribuibili alla famiglia nel suo complesso (redditi da capitale) vengono assegnati interamente alla persona di riferimento (NORD=1).

Come posso sapere se un dato è stato imputato?

Le variabili del questionario presenti sia negli archivi annuali sia nell'archivio storico non contengono dati imputati. I dati mancanti (non sa, non vuole rispondere, non applicabile) sono indicati con ".".

Le variabili aggregate come il reddito e la ricchezza della famiglia sono calcolate imputando i dati mancanti.

Cosa è e a cosa serve il peso campionario?

Il peso campionario è un coefficiente di ponderazione assegnato a ciascuna famiglia intervistata che permette di ottenere stime non distorte dei fenomeni di interesse.

Questo peso è ottenuto per mezzo di una procedura articolata nelle seguenti fasi:

  1. inizialmente viene calcolato il peso da disegno come reciproco della probabilità di inclusione delle unità;
  2. si ottiene poi un peso corretto per la mancata risposta totale moltiplicando il peso da disegno per l'inverso del tasso di risposta del comune cui ciascuna unità appartiene;
  3. infine, il peso viene aggiustato in modo che il campione riproduca alcune informazioni socio-demografiche rilasciate dall'Istat (distribuzione della popolazione per sesso, classi di età, area geografica, dimensione del comune di residenza.)

Negli archivi annuali i pesi campionari delle famiglie sono presenti nel file CARCOMxx (dove xx indicano le ultime due cifre dell'anno di riferimento dell'indagine), variabile PESOFIT. Tutti i componenti della stessa famiglia hanno lo stesso peso. Nell'archivio storico i pesi campionari si trovano nel file PESO, variabile PESO. Per ogni indagine, la somma dei pesi di tutte le famiglie restituisce il numero di famiglie intervistate. I valori delle variabili PESO e PESOFIT possono essere diversi poiché, i coefficienti annuali (PESOFIT) una volta rilasciati non vengono aggiornati mentre i coefficienti presenti nell'archivio storico (PESO) sono aggiornati costantemente alle informazioni più recenti rilasciate dall'Istat. Nel file PESO è disponibile anche la variabile PESOPOP, ottenuta moltiplicando la variabile PESO per una costante (diversa per ciascun anno di indagine) che consente la stima dei totali riferiti all'universo della popolazione italiana (popolazione residente).

A partire dall'indagine sul 2020, la costruzione dei pesi campionari è stata rivista per tenere conto dell'introduzione della stratificazione delle famiglie nel secondo stadio del disegno. Per consentire il confronto storico dei dati dell'indagine condotta con il nuovo disegno di campionamento con le precedenti edizioni è stato inoltre costruito un peso specifico, attraverso una tecnica di ribilanciamento iterativo dei pesi (raking), che consente di ridurre la differenza nella probabilità di selezione delle famiglie nel nuovo disegno rispetto al precedente.

Dall'edizione sul 2020, la variabile PESOFIT dell'archivio annuale rappresenta il peso campionario ottenuto con il nuovo disegno e non consente confronti con gli anni precedenti. Mentre la variabile PESO dell'archivio storico rappresenta il peso campionario ottenuto con la tecnica di ribilanciamento che consente il confronto con le precedenti edizioni.

Nelle analisi statistiche, in generale, si raccomanda l'uso dei pesi campionari per ottenere stime non distorte.

Per un'analisi dettagliata sul processo di ponderazione nell'IBF fino all'edizione sul 2016 si veda I. Faiella e R. Gambacorta, The weighting process in the Shiw, Banca d'Italia, Temi di Discussione, n.636, 2007.

Per un approfondimento sulle modifiche introdotte nel processo di ponderazione nell'IBF a partire dall'edizione sul 2020 si veda il fascicolo Metodi e fonti: note metodologiche R. Gambacorta e E. Porreca, Bridging techniques in the redesign of the Italian survey on household income and wealth, Banca d'Italia, Questioni di economia e finanza, di prossima pubblicazione.

Cosa sono e a cosa servono i pesi di replicazione?

I pesi di replicazione sono dei coefficienti di ponderazione che permettono di calcolare gli errori standard degli stimatori tenendo conto del disegno di campionamento.

Attraverso gli errori standard è possibile verificare ipotesi e costruire intervalli di confidenza per le statistiche di interesse.

I pesi di replicazione sono costruiti selezionando dal campione originario dei sotto-campioni casuali sulla base dello stesso disegno di campionamento dell'indagine e secondo una determinata metodologia di replicazione. Per ciascun sotto-campione vengono ricalcolati i pesi campionari come se quello fosse il campione effettivamente intervistato. Questi pesi vengono poi utilizzati per replicare il calcolo dello stimatore di interesse sui sotto-campioni selezionati. Un importante vantaggio di questa metodologia è che permette ai ricercatori di calcolare in modo corretto gli errori standard senza che vengano rese disponibili informazioni sui comuni campionati (garantendo in questo modo la riservatezza delle famiglie intervistate).

Dall'indagine 2008 sono disponibili i pesi di replicazione calcolati con il metodo Jackknife. I pesi sono contenuti negli archivi annuali nel file PESIJACKxx, dove xx indicano le ultime due cifre dell'anno di riferimento e sono denominati PWTx dove x indica il numero progressivo della replicazione. Sulla costruzione dei pesi di replicazione e sul loro utilizzo per la stima della varianza campionaria nell'indagine sui bilanci delle famiglie italiane si veda il fascicolo Metodi e fonti: note metodologiche.

In relazione alle problematiche relative all'inferenza con piani campionari complessi e sul modello adottato per la stima della varianza si veda Faiella, I. (2008) "Accounting for sampling design in the SHIW" , Temi di discussione n. 662 - Aprile.

Perché alcune variabili presenti nel questionario o nella documentazione dell'archivio storico non sono disponibili?

La Banca d'Italia non distribuisce in alcun modo i dati elementari delle variabili del questionario segnate con asterisco nel rispetto della tutela della riservatezza delle famiglie intervistate. Infatti tali dati (quali giorno e mese di nascita, comune e provincia di residenza, il codice ABI ecc.) potrebbero consentire l'univoca identificazione, diretta o indiretta, delle famiglie.