2.1 Introduzione

Nell'era analogica, la raccolta di dati sul comportamento-chi fa che cosa, quando, era costoso e, quindi, relativamente rari. Ora, nell'era digitale, i comportamenti di miliardi di persone sono registrate, conservate e analizzabile. Ad esempio, ogni volta che si clicca su un sito web, effettuare una chiamata sul telefono cellulare, o pagare per qualcosa con la vostra carta di credito, un record digitale del vostro comportamento è creato e memorizzato da un'azienda. Poiché questi dati sono un sottoprodotto di azioni quotidiane delle persone, sono spesso chiamati tracce digitali. In aggiunta a queste tracce detenuti da imprese, i governi hanno anche i dati incredibilmente ricche circa entrambe le persone e le imprese, i dati che è spesso digitalizzati e analizzabile. Insieme, questi documenti aziendali e governativi sono spesso chiamati Big Data.

L'inondazione sempre crescente dei Big Data significa che siamo passati da un mondo in cui i dati comportamentali erano scarsi in un mondo in cui i dati comportamentali è abbondante. Ma, perché questi tipi di dati sono relativamente nuovi, un importo sfortunato di ricerca che li utilizzano assomiglia scienziati inseguono ciecamente dati disponibili. In questo capitolo, invece, propone un approccio di principio per comprendere le diverse fonti di dati e come essi possono essere utilizzati. Questa comprensione più ricco dovrebbe aiutare a meglio si adattano ai tuoi quesiti di ricerca di appropriate fonti di dati. O, se tali fonti esistenti sono carenti, convincerti a raccogliere i propri dati utilizzando le idee nei prossimi capitoli.

Un primo passo per imparare dai Big Data è rendersi conto che è parte di una categoria più ampia di dati che è stata usata per la ricerca sociale per molti anni: dati osservativi. Approssimativamente, dati osservazione è alcun dato che risulta dall'osservazione un sistema sociale senza intervenire in alcun modo. Un modo rozzo di pensare a questo proposito è che i dati di osservazione è tutto ciò che non comporta parlare con le persone (ad esempio, indagini, l'argomento del Capitolo 3) o cambiando ambienti delle persone (ad esempio, gli esperimenti, l'argomento del capitolo 4). Così, oltre ai documenti aziendali e governativi, i dati di osservazione comprende anche cose come il testo di articoli di giornale e foto satellitari.

Questo capitolo ha tre parti. In primo luogo, nella sezione 2.2, descrivo big data in modo più dettagliato e chiarire una differenza fondamentale tra questo e dei dati che sono stati generalmente utilizzato per la ricerca sociale in passato. Poi, nella sezione 2.3, descrivo dieci caratteristiche comuni delle grandi fonti di dati. La comprensione di queste caratteristiche consente di riconoscere rapidamente i punti di forza e di debolezza di fonti esistenti e ci aiuterà a sfruttare la nuove fonti che verranno creati in futuro. Infine, nella sezione 2.4, descrivo tre principali strategie di ricerca che è possibile utilizzare per imparare dai dati di osservazione: le cose che contano, le cose di previsione, e approssimare un esperimento.