3.6 Sondaggi collegati a grandi fonti di dati

Il collegamento di sondaggi a fonti di dati di grandi dimensioni consente di produrre stime che sarebbero impossibili con entrambe le origini dati singolarmente.

La maggior parte dei sondaggi sono sforzi autonomi e autonomi. Non si basano l'uno sull'altro e non sfruttano tutti gli altri dati esistenti nel mondo. Questo cambierà. C'è ancora troppo da guadagnare collegando i dati dei sondaggi alle grandi fonti di dati discusse nel capitolo 2. Combinando questi due tipi di dati, è spesso possibile fare qualcosa che era impossibile con uno di questi due.

Ci sono un paio di modi diversi in cui i dati del sondaggio possono essere combinati con le grandi fonti di dati. In questa sezione descriverò due approcci che sono utili e distinti, e li chiamerò domande più complesse e richieste amplificate (figura 3.12). Sebbene illustrerò ciascun approccio con un esempio dettagliato, dovresti riconoscere che si tratta di ricette generali che potrebbero essere utilizzate con diversi tipi di dati di sondaggi e tipi diversi di big data. Inoltre, dovresti notare che ognuno di questi esempi può essere visualizzato in due modi diversi. Ripensando alle idee del capitolo 1, alcune persone considereranno questi studi come esempi di dati di sondaggi "custommati" che aumentano i big data "readymade", e altri li vedranno come esempi di dati di sondaggio "pronti all'uso" per i big data. Dovresti essere in grado di vedere entrambe le viste. Infine, dovresti notare come questi esempi chiariscano che sondaggi e fonti di big data sono complementi e non sostituti.

Figura 3.12: Due modi per combinare le grandi fonti di dati e i dati dei sondaggi. Nella richiesta arricchita (sezione 3.6.1), la grande fonte di dati ha una misura di interesse di base e i dati dell'indagine creano il contesto necessario attorno ad esso. Nella domanda amplificata (sezione 3.6.2), la grande fonte di dati non ha una misura di interesse di base, ma è usata per amplificare i dati dell'indagine.

Figura 3.12: Due modi per combinare le grandi fonti di dati e i dati dei sondaggi. Nella richiesta arricchita (sezione 3.6.1), la grande fonte di dati ha una misura di interesse di base e i dati dell'indagine creano il contesto necessario attorno ad esso. Nella domanda amplificata (sezione 3.6.2), la grande fonte di dati non ha una misura di interesse di base, ma è usata per amplificare i dati dell'indagine.