N. 891 - La previsione del tasso di disoccupazione con i dati di ricerca Google

Go to the english version Cerca nel sito

di Francesco D'Amuri e Juri Marcuccinovembre 2012

Lo studio sottopone a verifica empirica la capacità di prevedere il tasso di disoccupazione negli Stati Uniti di un indice basato sulla frequenza con cui il motore di ricerca Google viene interrogato con parole chiave connesse con l’attività di ricerca di lavoro (Google Index). L’utilità dell’indice, disponibile dal gennaio del 2004, è valutata confrontando l’Errore Quadratico Medio (EQM) delle previsioni del tasso di disoccupazione ottenute con vari modelli che includono o escludono il Google Index tra le variabili esplicative.

I risultati mostrano come l’indicatore migliori significativamente la performance previsiva dei modelli normalmente utilizzati in letteratura: l’EQM del miglior modello che utilizza i dati Google risulta inferiore di circa il 30 per cento rispetto a quello della migliore previsione ottenuta senza di esso. L’utilizzo dell’indice consente, inoltre, di migliorare le previsioni del tasso di disoccupazione statunitense anche rispetto a modelli stimati mediante dati relativi a periodi più lunghi, per i quali l’indice non è disponibile.

Test econometrici di abilità previsiva (equal forecast accuracy e model confidence set), che questo lavoro applica per la prima volta nella letteratura sulla previsione della disoccupazione negli Stati Uniti, confermano la superiorità dei modelli che includono l’indice di Google tra le variabili esplicative.

Questi risultati sono confermati anche qualora si modifichi lievemente la metodologia di verifica empirica o quella di costruzione dell’indice. Le proiezioni del migliore modello stimato a livello federale includendo il Google Index hanno un EQM nettamente inferiore anche rispetto a quello calcolato utilizzando le aspettative censite dalla Survey of Professional Forecasters della Federal Reserve Bank di Philadelphia presso circa 30 previsori professionisti.

Ripetendo l’esercizio previsivo su ciascuno dei 50 stati americani e il distretto federale (Washington, Di strict of Columbia), in più del 50 per cento dei casi il miglior modello sfrutta i dati di ricerca Google. Anche indici basati su parole chiave alternative, sempre connesse con la ricerca di lavoro ma meno rilevanti, permettono in molti casi di migliorare l’accuratezza delle previsioni.

Si è infine proceduto ad effettuare un test indiretto dei risultati ottenuti, analizzando la bontà previsiva di modelli che utilizzano un indice falso, ossia del Google Index maggiormente correlato con la serie storica della disoccupazione nel campione di stima ma che è estraneo alla ricerca di lavoro. Modelli che utilizzano questo indice non sono in grado di fornire previsioni più accurate di quelli standard.

In corso di pubblicazione in: International Journal of Forecasting

Pubblicato nel 2017 in: International Journal of Forecasting, v. 33, 4, pp. 801-816

Testo della pubblicazione