3.6 Undersøkelser knyttet til store datakilder

Kobling av undersøkelser til store datakilder gjør det mulig å produsere estimater som ville være umulige med hver enkelt datakilde individuelt.

De fleste undersøkelser er frittstående, selvstendige innsats. De bygger ikke på hverandre, og de utnytter ikke alle andre data som eksisterer i verden. Dette vil endres. Det er bare for mye å oppnå ved å koble kartdata til de store datakildene som er omtalt i kapittel 2. Ved å kombinere disse to typer data er det ofte mulig å gjøre noe som var umulig med hver enkelt enkelt.

Det finnes et par forskjellige måter hvor undersøkelsesdata kan kombineres med store datakilder. I denne delen beskriver jeg to tilnærminger som er nyttige og forskjellige, og jeg ringer dem beriket og spør og forsterket spør (figur 3.12). Selv om jeg skal illustrere hver tilnærming med et detaljert eksempel, bør du gjenkjenne at disse er generelle oppskrifter som kan brukes med ulike typer undersøkelsesdata og forskjellige typer store data. Videre bør du legge merke til at hvert av disse eksemplene kan sees på to forskjellige måter. Når man tenker tilbake til ideene i kapittel 1, vil noen se på disse studiene som eksempler på "custommade" undersøkelsesdata som forbedrer "readymade" store data, og andre vil se dem som eksempler på "readymade" store dataforbedrende "custommade" undersøkelsesdata. Du bør kunne se begge visningene. Til slutt bør du legge merke til hvordan disse eksemplene tydeliggjør at undersøkelser og store datakilder er utfyllende og ikke erstatter.

Figur 3.12: To måter å kombinere store datakilder og kartdata med. I beriket spør (avsnitt 3.6.1) har den store datakilden en kjernemåling av interesse, og undersøkelsesdataene bygger den nødvendige konteksten rundt den. I forsterket spør (avsnitt 3.6.2) har den store datakilden ikke en kjernemåling av interesse, men den brukes til å forsterke undersøkelsesdataene.

Figur 3.12: To måter å kombinere store datakilder og kartdata med. I beriket spør (avsnitt 3.6.1) har den store datakilden en kjernemåling av interesse, og undersøkelsesdataene bygger den nødvendige konteksten rundt den. I forsterket spør (avsnitt 3.6.2) har den store datakilden ikke en kjernemåling av interesse, men den brukes til å forsterke undersøkelsesdataene.